浅谈ROC曲线

机器学习中很常见的一个大类就是二元分类器。很多二元分类器会产生一个概率预测值,而非仅仅是0-1预测值。我们可以使用某个临界点(例如0.5),以划分哪些预测为1,哪些预测为0。得到

Классические методы статистики: критерий Кохрана-Мантеля-Хензеля для таблиц сопряженности размером 2 х 2 х K

В одном из предыдущих сообщений я описал, как в R можно рассчитать критерий хи-квадрат для таблиц сопряженности размером 2 х 2. Как правило, …

2012年的学习、工作和生活

在《英雄志》里面,沉毅木讷的伍定远一直到35岁才跳出公门、踏入江湖,由此获得一系列的奇遇、成长和体验,这番际遇让人感慨。既然2012的玛雅末日没有来,就将过去一年发生的事情在第…

Aktualizacja agregatora sondaży poparcia

Miesiąc temu przedstawiałem pierwszą wersję porównywarki wyników z sondaży poparcia dla różnych partii opracowanych przez cztery ośrodki badania opinii (CBOS, Homo Homini, SMG KRC, TNS Polska). Pracuję nad automatycznie aktualizującą się wersją powiązaną z RSSami z gazet, ale trochę jeszcze potrwa jej przygotowanie. A w międzyczasie uaktualniłem dane z sondaży poparcia z przełomu grudnia i […]

新书推荐:脏数据手册

当你学完一本数据分析软件教程,在电脑上做完了所有的练习题,志得意满地准备去处理实际问题时候,你会被真实世界的“脏数据”所震惊。例如那些随处可见的缺失和格式不一的数据会让…