Author Archive for 写长城的诗

用plyr包扩展apply族函数的功能

apply族函数是R语言中很有特色的一类函数,包括了apply、sapply、lapply、tapply、aggregate等等。在这篇博文里对它们进行了简略的说明。这一类函数本质上是将数据进行分割、计算和整合。它们在

30个免费数据资源网站

人们都喜欢听故事而不是看数字和公式,数据可视化可能是讲故事的终级神器。但这里有个前提条件,你首先得拥有数据。获取可靠的数据涉及到多个步骤,找到数据、整理清洁数据、转换为…

基于OpenStreetMap的地理信息绘图

开放街道地图(OpenStreetMap,简称OSM)是一个网上地图协作计划,目标是创造一个内容自由且能让所有人编辑的世界地图。OSM可以根据用户的手持GPS装置、航空摄影照片、卫星影像、其他自由

在R语言中使用正则表达式

有时候我们要处理的是非结构化的数据,例如网页或是电邮资料,那么就需要用R来抓取所需的字符串,整理为进一步处理的数据形式。R语言中有一整套可以用来处理字符的函数,在之前的博

在R中模拟存储问题

本例来自于《统计模型及其R实现》的例题,但是书上的条件和代码都有些缺漏,所以仍值得在这里说道说道。存储模型是很经典的统计模拟问题,即考虑一个出售某种商品的商店,其销售单

一个简单的狼兔追逐问题

四月八日,也就是春分月圆之后的首个星期日即是复活节(Easter)。而复活节兔是复活节象征之一。作为多产动物的兔子,象征了春天的复苏和新生命的诞生。此外,兔子是爱神阿弗洛狄特的宠

什么样的人能逃离泰坦尼克号?

1912年4月15日,英国皇家邮轮泰坦尼克号(RMS Titanic)在北大西洋撞上冰山沉没,1500多名乘客遇难,成为和平时期死亡人数最多的海难之一。这个沉船故事不断地为作家、电影制作人和歌曲作