Author Archive for 写长城的诗

R语言编程入门之三:输入与输出

如同ATM机一样,你首先得输入银行卡,才能输出得到钞票。数据分析也是如此,输入输出数据在分析工作中有重要的地位。下面对R语言中一些重要的输入输出函数进行小结,而其它的函数请

用R实现生命游戏(Game of Life)

生命游戏是英国数学家John Horton Conway在1970年发明的细胞自动机(cellular automaton)。它最初于1970年10月在《科学美国人》杂志中出现。生命游戏是在一个二维矩形世界中,这个世界中的每个方

R语言编程入门之二:对象和类

R是一种基于对象(Object)的语言,所以你在R语言中接触到的每样东西都是一个对象,一串数值向量是一个对象,一个函数是一个对象,一个图形也是一个对象。基于对象的编程(OOP)就是在定义类…

R语言编程入门之一:导论

简单来讲,编程是借助计算机来解决某个问题。学习编程的就是训练我们解决问题的能力。有这样一种说法:在未来,不会编程的人即是文盲。1 为什么要学习R编程大部分情况下解决某些问题…

新书推荐:大数据时代的工具集

该书简要介绍了60多种大数据相关的工具,从NoSQL到MapReduce,以及各种机器学习和可视化工具。初看这本书封面的时候很容易被唬住,以为又是O’Reilly出的一本大作。实际上它只是一本超薄的小…

关于Jeremy Lin的twitter词云

标签云或词云(word cloud)是关键词的视觉化描述,用于汇总用户生成的标签或一个网站的文字内容。word cloud实际上是将文档包含的词汇频率表进行了可视化。这些词汇的重要程度主要通过改变

数字显微镜下的林书豪

现在网络上最为炙手可热的人物恐怕就是NBA新星林书豪(Jeremy Lin)了,但是俗话说:不怕不识货,就怕货比货。这位初生牛犊与其它NBA巨星相比,到底有多么优秀?还有多少差距?还是让数