Author Archive for 写长城的诗

ggplot2绘图入门系列之一:导论

1 什么是ggplot2ggplot2是用于绘图的R语言扩展包,其理念根植于《Grammar of Graphics》一书。它将绘图视为一种映射,即从数学空间映射到图形元素空间。例如将不同的数值映射到不同的色彩或透明…

Twitter文本挖掘初步

Twitter已经成为社交媒体领域重要的信息来源,也是数据挖掘和可视化的重点研究对象。据说华尔街的多家对冲基金公司已经在利用twitter数据挖掘来衡量人们的情绪,从而预测资本市场的运动

数据挖掘项目失败的原因

注:本文编译自globalknowledgeblog.com在商业智能(BI)领域内,预测分析和数据挖掘(PADM)一直缓慢而稳步的成长。机器学习(Machine Learning)技术是支持PADM的重要驱动力量。在过去二十年间出现

用nls函数进行非线性回归

在许多实际问题中,回归模型中响应变量和预测变量之间的关系可能是复杂的非线性函数。有时候能通过变量变换的方法可以将其变为线性模型,有时则不能。在后一种情况下,就需要采取专…