Category: Chinese

关于Jeremy Lin的twitter词云

标签云或词云(word cloud)是关键词的视觉化描述,用于汇总用户生成的标签或一个网站的文字内容。word cloud实际上是将文档包含的词汇频率表进行了可视化。这些词汇的重要程度主要通过改变

数字显微镜下的林书豪

现在网络上最为炙手可热的人物恐怕就是NBA新星林书豪(Jeremy Lin)了,但是俗话说:不怕不识货,就怕货比货。这位初生牛犊与其它NBA巨星相比,到底有多么优秀?还有多少差距?还是让数

用ggplot2包绘制风向风速玫瑰图

风向风速玫瑰图(wind rose)是气象学家常用的图形工具,描述了在一个特定的地点,其风速和风向是如何分布的。风向风速图实际上是一种条形图的扩展,它使用网格化的极坐标系统,用不同…

数据挖掘的错误与陷阱

1 只关注训练数据训练样本之外的数据才是真正重要的。安德森医疗中心的研究人员在十年前使用神经网络来检测癌症。相对于训练样本,他们的检验样本表现不佳,但还算不错的。但他们认

用图形和颜色来表现相关关系

进行数据分析建模首先要了解变量间的关系。对于连续数据来说,散点图可能是最为有效的一种工具。散点图通常对两组连续数据比较合适,如果是多元数据,那么可以使用散点图矩阵(Scatte…