Настройки конфигурации в R

При запуске R настройки считываются из нескольких файлов, которые подробно описаны тут. Для пользовательских настроек предполагается использовать два файла: .Renviron и .Rprofile , которые берутся из рабочей директории или домашней директории юзера. Первый предназначен для хранения переменных окружения, второй — для выполнения команд после запуска. Мои конфиги сейчас выглядят так: .Renviron: R_PDFLATEXCMD="~/texlive/2011/bin/x86_64-linux/pdflatex" R_LATEXCMD="~/texlive/2011/bin/x86_64-linux/latex" R_HISTSIZE=’100000′ Первые […]

再谈广义线性模型

广义线性模型(generalized linear model, GLM)是简单最小二乘回归(OLS)的扩展,在OLS的假设中,响应变量是连续数值数据且服从正态分布,而且响应变量期望值与预测变量之间的关系是线性关系。

Ceny używanych aut po nowym roku a prosty pająk sieciowy

Trzy miesiące temu opisywałem zbiór danych o ofertach sprzedaży samochodów z serwisu otomoto.pl (zobacz tutaj). Po kwartale ponownie zebrałem informacje o ofertach sprzedaży. Porównując te dwa zbiory będzie można sprawdzić jak zmieniają się ceny różnych modeli w odpowiedzi na podwyższoną akcyzę na olej napędowy. Kolejne interesujące pytanie to globalna zmiana cen aut używanych w ,,czasach […]

Moneyball与体育数据挖掘

培根曾说,知识就是力量。如果以Billy Beane的角度来看,他也许会说,数据就是金钱。一、背景《Moneyball》是Michael Lewis在2003年出版的一本书,讲述奥克兰运动家棒球队总经理比利·比恩(Billy …