Polish

Z pamiętnika nauczyciela akademickiego

Jedną z zaproszonych prelegentek na useR 2016 była Deborah Nolan z referatem ,,Statistical Thinking in a Data Science Course’’. Dora jest profesorem na Berkeley, zajmuje się między innymi technikami nauczania statystyki i napisała świetną książkę ,,Teaching Statistics: A Bag of Tricks’’. Jest też orędowniczką wizualizacji danych i poznawania statystyki przez eksperyment. W swoim referacie poruszyła … Czytaj dalej Z pamiętnika nauczyciela akademickiego

Przyszłość ggvis

W przybliżeniu taki tytuł nosił referat Hadleya Wickhama, ale w rzeczywistości był to referat o przyszłości universum pakietów tworzonych i współtworzonych przez Hadleya. A jest to ciekawy kierunek, więc poniżej napiszę o nim trochę więcej. (btw: zaproponował by zamiast hadleyverse używać nazwy tidyverse. Dlaczego tidy? o tym poniżej). Prezentacja była świetnie przygotowana. Była jedną z … Czytaj dalej Przyszłość ggvis

eRka: wakacyjny zespołowy konkurs z R

eRka wspólnie z Do-IT Solutions (z patronami INIME, FuRBS i SmarterPoland.pl) przygotowała na te wakacje zespołowy konkurs analizy danych. Dane dotyczą wyników edukacyjnych uczniów z RPA. Być może pamiętacie, że dane były wykorzystywane w hackatonie organizowanym przez eRka rok temu, ale teraz i danych jest więcej i wyzwań jest więcej. Więcej informacji o tym konkursie, … Czytaj dalej eRka: wakacyjny zespołowy konkurs z R

useR 2016 – tutoriale

Właśnie zakończył się pierwszy dzień useR2016, czyli sesja z tutorialami. Do wyboru było wiele ciekawych pozycji (lista z opisami tutaj). Poniżej opiszę wrażenia z czterech, w których uczestniczyłem. Never Tell Me the Odds! Machine Learning with Class Imbalances Max Kuhn – Pfizer. Materiały do tego tutorialu znajdują się na githubie. Max (znany pewnie większości jako … Czytaj dalej useR 2016 – tutoriale

Obejrzyj dane zanim je pokażesz

Dzisiaj Polityka opublikowała artykuł Rząd zapowiadał, że ograniczy biurokrację. Zamiast tego cudownie się rozmnożył. W artykule są przykłady rosnącej biurokracji, tutaj mierzonej liczbą ministrów i wiceministrów. Generalnie lubię w Polityce to, że często (w porównaniu z innymi portalami) opierają się na liczbach. Choć niestety rzadko pokazują te liczby za pomocą wykresu, zazwyczaj są to tabele … Czytaj dalej Obejrzyj dane zanim je pokażesz

Shiny + archivist = reproducible interactive exploration

Shiny is a great tool for interactive exploration (and not only for that). But, due to its architecture, all objects/results that are generated are stored in a separate R process so you cannot access them easily from your R console. In some cases you may wish to retrieve a model or a plot that you … Czytaj dalej Shiny + archivist = reproducible interactive exploration

EURO 2016 v2

Ostatnio pisałem o artykule w którym uzgadniano szanse wygrania Euro przez drużyny na bazie zakładów bukmacherskich. Dostępny zbiór danych wykorzystaliśmy na ostatnich zajęciach ze Statystyki 2 do zabawy w przewidywanie czy Polska wyjdzie z grupy. Różne osoby, próbowały różnych modeli, jeden przypadł mi szczególnie do gustu i poniżej go opiszę. Model jest taki: jeżeli drużyna … Czytaj dalej EURO 2016 v2

EURO 2016

Krzysiek Trajkowski podesłał mi link do artykułu ,,Predictive Bookmaker Consensus Model for the UEFA Euro 2016”. Na podstawie danych z 19 serwisów z zakładami internetowymi autorzy zbudowali jeden zintegrowany model probabilistyczny. Tabela z danymi z poszczególnych serwisów (tabela 3) dla wszystkich krajów jest tutaj: https://github.com/pbiecek/StatystykaII/blob/master/MIMUW_2016/materialy/euro2016_odds.csv. Wartości z tabeli to fixed odds na zwycięstwo w turnieju. … Czytaj dalej EURO 2016