Posts Tagged ‘ 随机森林 ’

用Parallel和foreach包玩转并行计算

September 26, 2012
By
用Parallel和foreach包玩转并行计算

众所周知,在大数据时代R语言有两个弱项,其中一个就是只能使用单线程计算。但是在2.14版本之后,R就内置了parallel包,强化了R的并行计算能力。parallel包实际上整合了之前已经比较成熟的s...

Read more »

随机森林及其副产品

July 15, 2012
By
随机森林及其副产品

随机森林(Random Forest)方法是Leo Breiman于2001年提出的一种集成学习(Ensemble Learning)方法,它是传统决策树方法的扩展,将多个决策树进行组合,来提高预测精度。随机森林利用分类回归树(CART)

Read more »

降维中的特征选择

June 5, 2012
By
降维中的特征选择

在数据挖掘过程中,高维数据是非常棘手的研究对象。特别是在文本挖掘、图像处理和基因数据分析中,维度过高使很多学习器无法工作或效率降低,所以降维也是数据预处理过程的一项必要...

Read more »