Polish

Maraton zespołowej analizy danych – hackujemy maturę z matematyki

9 maja ruszamy z maratonem analizy danych. Przygotowaliśmy trzy ciekawe problemy analityczne, dzisiaj przedstawimy drugi z nich. W skrócie – hackujemy maturę z matematyki. Mając dane o wynikach z matury z matematyki (wyniki dla _każdego_ maturzysty z lat 2011, 2014, w sumie ponad 640 000 wyników), oraz płci, roczniku, szkole, gminie, województwie i _wielu_ innych … Czytaj dalej Maraton zespołowej analizy danych – hackujemy maturę z matematyki

Maraton zespołowej analizy danych – walczymy z rakiem

9 maja ruszamy z maratonem analizy danych. Przygotowaliśmy trzy ciekawe problemy analityczne, dzisiaj pokażemy pierwszy z nich. Zaczniemy jak u Hitchcocka, Jeden z najlepszych na świecie zespołów biologów molekularnych, badających odporność nowotworów na chemioterapie, pracuje z gigantyczną bazą danych o nowotworach The Cancer Genome Atlas Project (ponad 14 tys pacjentów, publicznie dostępne dane ważące kilkanaście … Czytaj dalej Maraton zespołowej analizy danych – walczymy z rakiem

Jakie kolory są częstsze w różnych markach

Tydzień temu szukaliśmy koloru, który cechuje samochody o najmocniejszych silnikach. Okazało się, że czarny i czarny metallic to kolory spotykane w silnych autach. Ale moc silnika to nie wszystko. Zobaczmy jaka jest relacja pomiędzy kolorem a marką. W zbiorze danych auta2012 (pakiet PogromcyDanych) mamy jednak 37 kolorów i 106 marek, jak tu czytelnie pokazać zależność … Czytaj dalej Jakie kolory są częstsze w różnych markach

Maraton zespołowej analizy danych

Pomysł na hackaton analityczny pojawił się jakiś czas temu, dojrzewał, dojrzewał i zaowocował maratonem zespołowej analizy danych. Ale o co chodzi? 9 maja (tak, zapiszcie tę datę do kalendarza) zderzymy grupę kilkudziesięciu uczestników z trzema rzeczywistymi problemami, z nauki i z biznesu, wymagającymi analizy dużych danych. Pracując przez około 11 godzin (od 9 do 20, … Czytaj dalej Maraton zespołowej analizy danych

Financial Times a SmarterPoland

Na blogu Revolution Analytics można przeczytać, że Financial Times Data Section używa R i pakietu SmarterPoland aby przedstawiać interaktywną wizualizację danych o bezrobociu (SmarterPoland pośredniczy w dostępie do danych z Eurostatu). Jak używać używając tego pakietu i dobierać się do dowolnej tabeli z Eurostatu? Omawiamy ten sposób pobierania danych w czwartym odcinku Pogromców Danych (pierwszy … Czytaj dalej Financial Times a SmarterPoland

Czwartek SER, piątek PAZUR

Co za tydzień. Na jutro mamy dla Was wpis o Bardzo Bardzo Ciekawej Imprezie, w czwartek w Warszawie na wydziale MINI odbędzie się Spotkanie Entuzjastów R a w piątek w Poznaniu PAZUR. Poniżej słów kilka od organizatorów spotkań w Poznaniu. — Maciej Beręsewicz SKN Estymator, Katedra Statystyki UEP oraz Katedra Metod Matematycznych i Statystycznych UP … Czytaj dalej Czwartek SER, piątek PAZUR

Czternaście wybranych testów normalności

Ten wpis jest wprowadzeniem / rozpoznaniem gruntu dla pewnej ciekawej inicjatywy wydawniczej, o której napiszę w czwartek. Tekst ten jest bardzo techniczny, przeznaczony dla osób znających postawy teorii testowania hipotez. Pod koniec stycznia miałem przyjemność prowadzić szkolenie z testów statystycznych ,,na poważnie”. Odbiorcami była wymagająca grupa dociekliwych, pracujących w KNFie. Część szkolenia dotyczyła testów normalności, [...]

Pięć raportów od wielkanocnego zająca

Tak naprawdę to nie od zająca, ale od Krzyśka Trajkowskiego. Ale zacznijmy od początku. Jakiś czas temu [to już cztery lata?] pracowałem nad zbiorem ,,luźnych” notatek w okolicy eksploracji danych, czego wynikiem był dokument ,,Na przełaj przez Data Mining”. Do prac nad tym dokumentem dołączył Krzysiek i w aktualnej [jeszcze nie ukończonej] wersji, połowa rozdziałów [...]