Blog Archives

新书推荐:《Visualize This》

December 17, 2011
By
新书推荐:《Visualize This》

这是一个数据的时代,各种数据铺天盖地涌现出来,如何从中获取有用的信息?人类的大脑喜欢图形,因此将数据可视化或许是种方法。数据可视化是美学、数据分析和专业知识的结合,能以...

Read more »

缺失数据的处理

December 13, 2011
By
缺失数据的处理

对于缺失数据通常有几种应付手段,一种是当缺失数据较少时直接删除相应样本,另一种是对缺失数据进行插补,最后是使用对缺失数据不敏感的分析方法,例如决策树。基本上缺失数据处理...

Read more »

qplot绘图函数快速入门

December 10, 2011
By
qplot绘图函数快速入门

绘图是进行数据探索分析的重要方法,也是数据报告中的必备元素。但进行多元数据绘图时,R语言中的基本绘图工具往往很不给力,使用lattice包又要记一大堆命令。在你痛苦不堪的时候,需

Read more »

多层回归模型简介

December 8, 2011
By
多层回归模型简介

多层回归模型(Multi-level model)中有很多容易混淆的概念,因为很多概念是来源于不同的专业背景。首先让我们先罗列这些名词进行区分,再来R语言来举例。多层回归模型通常涉及到对同一个...

Read more »

加性模型(Additive Model)在R中的实现

December 7, 2011
By
加性模型(Additive Model)在R中的实现

加性模型是一种非参数模型,如果说二维散点图的平滑是简单线性回归模型的一般化,那么加性模型就是多元回归模型的一般化。加性模型非常具有灵活性,因为它不象参数模型那样需要假设...

Read more »

在R语言中进行局部多项式回归拟合(LOESS)

December 5, 2011
By
在R语言中进行局部多项式回归拟合(LOESS)

局部多项式回归拟合是对两维散点图进行平滑的常用方法,它结合了传统线性回归的简洁性和非线性回归的灵活性。当要估计某个响应变量值时,先从其预测变量附近取一个数据子集,然后对...

Read more »

在R语言中用自助法求统计量置信区间

December 4, 2011
By
在R语言中用自助法求统计量置信区间

当样本不符合理论分布假设时,求样本统计量的置信区间就成为一个难题。而自助法(Bootstrap)的思路是对原始样本重复抽样产生多个新样本,针对每个样本求取统计量,然后得到它的经验分布

Read more »

参数检验、非参数检验与置换检验的比较

December 4, 2011
By
参数检验、非参数检验与置换检验的比较

当我们研究的样本处于良好情况下(近似正态、无离群点、数据量大等),传统的参数检验是很有效的。但是当这些前提条件不再满足时,参数检验就不再有效。此时人们往往求助于非参数检...

Read more »