Chinese

用Parallel和foreach包玩转并行计算

September 26, 2012
By
用Parallel和foreach包玩转并行计算

众所周知,在大数据时代R语言有两个弱项,其中一个就是只能使用单线程计算。但是在2.14版本之后,R就内置了parallel包,强化了R的并行计算能力。parallel包实际上整合了之前已经比较成熟的s...

Read more »

使用GitHub进行版本控制的傻瓜方法

September 22, 2012
By
使用GitHub进行版本控制的傻瓜方法

不论是团队合作还是单打独斗,代码和文档的版本控制是数据极客不可缺少的工具。高阶极客能随心所欲的用 linux终端+Git+编辑器完成这类任务。但是对于像本人一样的Git入门者来讲,图形工

Read more »

抓取网页数据的几种套路

September 21, 2012
By
抓取网页数据的几种套路

没有数据就没有乐趣。有的数据提供者心肠很好,会直接给出txt或是csv文档。这个时候我们可以直接在R里头用read.table()函数把数据读进来。有的时候我们需要的数据在网页上以一个表格呈现

Read more »

如何在WIN下写一个简单的R包

September 19, 2012
By
如何在WIN下写一个简单的R包

虽然玩了一段时间的R,但很惭愧的是一直没有学着自己编写一个R包。一个是觉得R本身的包已经是浩如烟海了,另一个感觉好象写包非常麻烦。在参加完北京的这次统计夏令营后,看太云讲写...

Read more »

笨办法学R编程(6)

September 2, 2012
By
笨办法学R编程(6)

有时候用R来解一些Project Euler的题目会非常简单,今天就来三题连解(6、7、8)。题目就不再这里复述了,可以查看官方网站。用到函数和表达式大部分在前面都已经熟悉过了,不过还是会接

Read more »

EM算法的R实现和高斯混合模型

August 30, 2012
By
EM算法的R实现和高斯混合模型

EM(Expectatioin-Maximalization)算法即期望最大算法,被誉为是数据挖掘的十大算法之一。它是在概率模型中寻找参数最大似然估计的算法,其中概率模型依赖于无法观测到的隐变量。最大期望算

Read more »

笨办法学R编程(5)

August 25, 2012
By
笨办法学R编程(5)

随着教程推进,基本的语法都接触得差不多了。当要解决某个具体问题时,只需要考虑用什么样的算法来整合运用这些函数和表达式。今天来解决Project Euler的第五个问题,该问题可以用很笨

Read more »

笨办法学R编程(4)

August 22, 2012
By
笨办法学R编程(4)

看到各位对“笨办法系列”的东西还比较感兴趣,我也很乐意继续写下去。今天的示例将会用到数据框(data.frame)这种数据类型,并学习如何组合计算两个向量,以及如何排序。我们将用所

Read more »