数据挖掘之你问我答(4/5)

注:本文是由Tim Graettinger的文章编译而来问题四:我的模型在训练数据上表现很好,为什么在新数据上表现很糟?你遇到的就是被称为“过度拟合”(over-fit)的典型症状。通常是在为稀有事件

数据挖掘之你问我答(3/5)

注:本文是由Tim Graettinger的文章编译而来问题三:进行数据挖掘需要多少数据?这是迄今为止关于数据挖掘最常见的问题,这个问题得到如此多的关注是有其原因的。当你第一次进行数据挖掘…

KoNLP 패키지 등록

http://cran.r-project.org/web/packages/KoNLP/ 오늘 등록 했습니다. 윈도우 바이너리는 좀 기다려야 할 듯 하네요. R user conference 2011 회의때 이야기한 한글 텍스트마이닝 패키지 약속에 대해서 이제 그나