Author: smarterpoland

eRka: wakacyjny zespołowy konkurs z R

eRka wspólnie z Do-IT Solutions (z patronami INIME, FuRBS i SmarterPoland.pl) przygotowała na te wakacje zespołowy konkurs analizy danych. Dane dotyczą wyników edukacyjnych uczniów z RPA. Być może pamiętacie, że dane były wykorzystywane w hackatonie organizowanym przez eRka rok temu, ale teraz i danych jest więcej i wyzwań jest więcej. Więcej informacji o tym konkursie, … Czytaj dalej eRka: wakacyjny zespołowy konkurs z R

useR 2016 – tutoriale

Właśnie zakończył się pierwszy dzień useR2016, czyli sesja z tutorialami. Do wyboru było wiele ciekawych pozycji (lista z opisami tutaj). Poniżej opiszę wrażenia z czterech, w których uczestniczyłem. Never Tell Me the Odds! Machine Learning with Class Imbalances Max Kuhn – Pfizer. Materiały do tego tutorialu znajdują się na githubie. Max (znany pewnie większości jako … Czytaj dalej useR 2016 – tutoriale

Obejrzyj dane zanim je pokażesz

Dzisiaj Polityka opublikowała artykuł Rząd zapowiadał, że ograniczy biurokrację. Zamiast tego cudownie się rozmnożył. W artykule są przykłady rosnącej biurokracji, tutaj mierzonej liczbą ministrów i wiceministrów. Generalnie lubię w Polityce to, że często (w porównaniu z innymi portalami) opierają się na liczbach. Choć niestety rzadko pokazują te liczby za pomocą wykresu, zazwyczaj są to tabele … Czytaj dalej Obejrzyj dane zanim je pokażesz

EURO 2016 v2

Ostatnio pisałem o artykule w którym uzgadniano szanse wygrania Euro przez drużyny na bazie zakładów bukmacherskich. Dostępny zbiór danych wykorzystaliśmy na ostatnich zajęciach ze Statystyki 2 do zabawy w przewidywanie czy Polska wyjdzie z grupy. Różne osoby, próbowały różnych modeli, jeden przypadł mi szczególnie do gustu i poniżej go opiszę. Model jest taki: jeżeli drużyna … Czytaj dalej EURO 2016 v2

EURO 2016

Krzysiek Trajkowski podesłał mi link do artykułu ,,Predictive Bookmaker Consensus Model for the UEFA Euro 2016”. Na podstawie danych z 19 serwisów z zakładami internetowymi autorzy zbudowali jeden zintegrowany model probabilistyczny. Tabela z danymi z poszczególnych serwisów (tabela 3) dla wszystkich krajów jest tutaj: https://github.com/pbiecek/StatystykaII/blob/master/MIMUW_2016/materialy/euro2016_odds.csv. Wartości z tabeli to fixed odds na zwycięstwo w turnieju. … Czytaj dalej EURO 2016

SGT := Statystycza Gra Terenowa

Czas na kolejną zagadkę z serii BetaBit! Tym razem o poziomie trudności przygotowanym z myślą o gimnazjalistach/licealistach lub osobach rozpoczynających przygodę z odczytywaniem wykresów. Gra polega na odnalezieniu i rozwiązaniu siedmiu lub większej liczby zagadek statystycznych. Każda zagadka to wykres statyczny lub interaktywny wraz z zadaniem. Zadania są proste jeżeli dany wykres potrafi się odczytać. … Czytaj dalej SGT := Statystycza Gra Terenowa