Blog Archives

在R中进行基于稳健马氏距离的异常检验

July 11, 2012
By
在R中进行基于稳健马氏距离的异常检验

我们研究的数据中经常包含着一些不同寻常的样本,这称之为异常值(Outlier)。这些异常值会极大的影响回归或分类的效果。异常值产生的原因有很多,其中可能是人为错误、数据测量误差,或...

Read more »

谈一谈支持向量机分类器

July 6, 2012
By
谈一谈支持向量机分类器

支持向量机(Support Vector Machine)名字听起来很炫,功能也很炫,但公式理解起来常有眩晕感。所以本文尝试不用一个公式来说明SVM的原理,以保证不吓跑一个读者。理解SVM有四个关键名词:

Read more »

朴素贝叶斯分类与贝叶斯网络

July 3, 2012
By
朴素贝叶斯分类与贝叶斯网络

朴素贝叶斯分类(Naive Bayes Classifier)是一种简单而容易理解的分类方法,看起来很Naive,但用起来却很有效。其原理就是贝叶斯定理,从数据中得到新的信息,然后对先验概率进行更新,从而...

Read more »

用lubridate包来处理时间数据

July 1, 2012
By
用lubridate包来处理时间数据

人生有一道难题,那就是如何使一寸光阴等于一寸生命。在数据分析中也有一道难题,那就是如何自如的操作时间数据。R语言的基础包中提供了两种类型的时间数据,一类是Date日期数据,它

Read more »

用ggmap包进行地震数据的可视化

June 28, 2012
By
用ggmap包进行地震数据的可视化

最近又发现了一个比较好玩的包ggmap。从名字上可以猜测出来,它的作用就是将ggplot2和map相结合。这样R语言用户能方便的获取各种静态地图数据,并在其基础上使用强大的ggplot绘图工具。ggmap...

Read more »

如何用R来处理图片

June 27, 2012
By
如何用R来处理图片

做为“会电脑”的人,除了“友情”帮别人装系统杀杀毒之外,时常会承担一些图片处理的活。也就是对一些照片施加缩放、旋转、裁剪之类的事情。这类小事自然无需动用photoshop这种庞然大...

Read more »

ggplot的图形组合与添加jpeg文档的方法

June 19, 2012
By
ggplot的图形组合与添加jpeg文档的方法

最近有位朋友问了一个关于ggplot2作图的问题。涉及到多个图形组合的问题,所以还是费了一些时间来解决,自己也从中学习了一些新东西。顺手将这个画图的过程扔上来当作一篇博文吧。下

Read more »

初次尝试igraph包

June 17, 2012
By
初次尝试igraph包

igraph是为了进行社会网络分析而创建的一个包。与R语言中同类包相比,它的速度更快,而且函数命令与图形展现更为丰富。它可以处理有向网络和无向网络,但无法处理混合网络。igraph中的

Read more »