Chinese

rpart包和party包的简单比较

May 17, 2012
By
rpart包和party包的简单比较

决策树模型是一种简单易用的非参数分类器。它不需要对数据有任何的先验假设,计算速度较快,结果容易解释,而且稳健性强,不怕噪声数据和缺失数据。决策树模型的基本计算步骤如下:...

Read more »

分享几本数据挖掘书籍

May 15, 2012
By
分享几本数据挖掘书籍

The Elements of Statistical Learning: Data Mining, Inference, and Prediction广受推崇的统计学习书籍,重视理论基础,图文并茂,各种算法讲解清晰。但没有涉及实务中的问题,如特征选择。Principles_of_Data_Mini...

Read more »

用ggplot2包来绘制地图

May 10, 2012
By
用ggplot2包来绘制地图

自从四月份进行重大升级之后,0.90版的ggplot2包更新了很多新功能。之前的博文谈到了升级版的二维直方图。今天我们要谈的是绘制地图的新功能。其图形元素主要是通过geom_map来实现,在它

Read more »

为KNN分类器增加Cross-Validation功能

May 6, 2012
By
为KNN分类器增加Cross-Validation功能

有这么一句很有趣的话,如果一个东西走路象鸭子、叫起来象鸭子、吃起来也象鸭子,那它就是一只鸭子。这是一种很符合我们直觉的思维方式:将未知的对象和已知的东西相比较,如果各个...

Read more »

日历中的夏天

May 3, 2012
By
日历中的夏天

看着有节,摸着无节--打一生活用品不知不觉,夏日已慢慢临近。姑娘们飞扬的裙角,小贩叫卖的西瓜,蚊蝇嗡嗡的声音,以及翻过的一页日历,都提醒着你--夏天快来了。夏季有着不同的定

Read more »

关于机器学习的几个视频资源

May 3, 2012
By
关于机器学习的几个视频资源

最著名的视频课程可能就是斯坦福大学的机器学习公开课,在网易公开课栏目可以观看全部的20节课程。其中15节已经翻译有中文字幕。缺点是视频不算很清晰,而且好象全是黑板推算,理论

Read more »

用RJSONIO包调用天气数据

May 1, 2012
By
用RJSONIO包调用天气数据

JSON(JavaScript Object Notation)是一种轻量级的数据交换格式。易于阅读和编写,同时也易于机器解析和生成。 JSON采用完全独立于语言的文本格式,但是也使用了类似于C语言家族的习惯(包括C, C++,...

Read more »

广而告之

April 28, 2012
By
广而告之

本博客使用的图床(http://thumbsnap.com/)被墙,导致RSS订阅用户无法看到图。先暂时只能够翻墙访问了。如果有好的图床请给我留言。

Read more »