Blog Archives

在R中使用DataMarket的公开数据源

November 11, 2011
By
在R中使用DataMarket的公开数据源

在如今的商业世界中,各种数据和统计数字是非常重要的决策依据,但良好的数据通常很难获得。因为数据来源分散而且格式不一,世界各地的分析人员往往花费了无数的时间进行数据检索、...

Read more »

数据挖掘之你问我答(3/5)

November 10, 2011
By
数据挖掘之你问我答(3/5)

注:本文是由Tim Graettinger的文章编译而来问题三:进行数据挖掘需要多少数据?这是迄今为止关于数据挖掘最常见的问题,这个问题得到如此多的关注是有其原因的。当你第一次进行数据挖掘...

Read more »

R语言新书:R并行计算

November 8, 2011
By
R语言新书:R并行计算

近年来R语言已经成为流行的开源数据分析软件,但其局限性在于单处理器核心作业和内存限制。想要成为跨平台的优秀软件,则必须经过商用海量数据的考验。而并行计算是一种当前热门的

Read more »

R语言基础入门之三:常用统计函数运算

November 7, 2011
By
R语言基础入门之三:常用统计函数运算

在R语言中经常会用到函数,例如上节中讲到的求样本统计量就需要均值函数(mean)和标准差函数(sd)。对于二元数值数据还用到协方差(cov),对于二元分类数据则可以用交叉联列表函数(table)。下

Read more »

数据挖掘之你问我答(2/5)

November 7, 2011
By
数据挖掘之你问我答(2/5)

注:本文是由Tim Graettinger的文章翻译而来问题二:如何使决策者购买我的数据挖掘项目?一般我都是以自身经验有感而发的,所以,我谈论的这些东西并非基于对人或企业行为的详尽研究。这...

Read more »

数据挖掘之你问我答(1/5)

November 4, 2011
By
数据挖掘之你问我答(1/5)

注:本文是由Tim Graettinger的文章翻译而来问题一:你推荐什么样的数据挖掘工具?首先,我们需要搞清楚一些东西:你的数据挖掘目标是什么?你的团队怎么样?目前正在使用的工具和能力如...

Read more »

R语言基础入门之二:数据导入和描述统计

October 30, 2011
By
R语言基础入门之二:数据导入和描述统计

一、数据导入对初学者来讲,面对一片空白的命令行窗口,第一道真正的难关也许就是数据的导入。数据导入有很多途径,例如从网页抓取、公共数据源获得、文本文件导入。为了快速入门,...

Read more »

R语言基础入门之一:引言

October 28, 2011
By
R语言基础入门之一:引言

一、什么是R语言R语言是一个开源的数据分析环境,起初是由数位统计学家建立起来,以更好的进行统计计算和绘图,这篇wiki中包含了一些基本情况的介绍。由于R可以通过安装扩展包(Packages...

Read more »