Polish

Czy Internet pozwala przewidzieć wyniki wyborów?

Dziś mamy gościnny wpis poświęcony analizie danych wyborczych a na wtorek mamy zaplanowany gościnny wpis poświęcony analizie danych finansowych. Dzisiejszy wpis przygotował dr Albert Hupa z IRCenter i są do niego dołączone dane z sondaży wyborczych, z Google Trends, z wypowiedzi na mediach społecznościowych, oraz badania CAWI wśród internautów. Dane z różnych źródeł, można trochę … Czytaj dalej Czy Internet pozwala przewidzieć wyniki wyborów?

GeCONiI – jak budować pakiety, reprodukowalne raporty i aplikacje webowe w R

W poprzednim tygodniu miałem przyjemność prowadzić szkolenie dotyczące różnych ciekawych inżynierskich aspektów programowania w R. Szkolenie było prowadzone dla Akademii GeCONiI na Politechnice Śląskiej. Dzięki uprzejmości organizatorów mogę podzielić się materiałami ze szkolenia. Całość jest dostępna na stronie GitHub a poszczególne tematy można znaleźć pod poniższymi linkami * Budowa pakietów z użyciem devtools * Odtwarzalne … Czytaj dalej GeCONiI – jak budować pakiety, reprodukowalne raporty i aplikacje webowe w R

Eseje i SERy

Dzisiejszy wpis to cztery splatające się wątki. Nie ma brzydkich danych – są tylko źle ubrane Kilkanaście osób wzięło udział w ogłoszonym w zeszłym tygodniu konkursie na hasło reklamujące Eseje. Dwa hasła, które najbardziej przypadły mi do gustu, to ,,Nie ma brzydkich danych – są tylko źle ubrane” i ,,Kto czyta eseje, Ten wody nie … Czytaj dalej Eseje i SERy

Hack the Proton. A data-crunching game from the Beta and Bit series

I’ve prepared a short console-based data-driven R game named ,,The Proton Game’’. The goal of a player is to infiltrate Slawomir Pietraszko’s account on a Proton server. To do this, you have to solve four data-based puzzles. The game can be played by beginners as well as heavy users of R. Survey completed by people … Czytaj dalej Hack the Proton. A data-crunching game from the Beta and Bit series

eXtreme Gradient Boosting vs Random Forest [i pakiet caret]

Drzewa decyzyjne są urocze. Można je wizualizować, łatwo wyjaśnić, łatwo stosować, łatwo nawet się je konstruuje. Ale niestety są niestabilne i nie nadają się do klasyfikacji danych o bardzo wysokim wymiarze i silnie skorelowanych zmiennych. Ale i z niestabilnością drzew można walczyć. Jedna z popularniejszych metod stabilizacji poszczególnych drzew to lasy losowe (drzewa budowane na … Czytaj dalej eXtreme Gradient Boosting vs Random Forest [i pakiet caret]

Jak Twoja szkoła wypadła na Nowej Maturze 2015?

Jakiś czas temu przedstawiliśmy ranking trudności zadań z nowej matury podstawowej z matematyki w roku 2015. Teraz przedstawiamy narzędzie do diagnozowania, które maturalne zadania wypadły lepiej, a które gorzej w Twojej szkole! Daje to unikalną możliwość sprawdzenia co jest słabą a co jest silną stroną danej szkoły. Może warto dodatkowo przedyskutować ze uczniami zadania, które … Czytaj dalej Jak Twoja szkoła wypadła na Nowej Maturze 2015?

Włam na Proton

Tydzień temu pisałem o tekstowej grze proton rozgrywanej w konsoli R. Przez tydzień wszystkie zaszyte tam zagadki udało się rozwiązać 25 osobom o różnych poziomach umiejętności. Poniższy wykres przedstawia deklarowany czas rozwiązania wszystkich zagadek. Okazuje się, że dla większości osób zabawa trwała od 15 do 60 minut, a cała gra okazała się prostsza, niż początkowo … Czytaj dalej Włam na Proton

R vs SAS vs SPSS

Takie tytuły rozpoczynają zazwyczaj spory o wyższość jednego święta nad drugim. Ale nie na tym blogu. Dzisiejszy wpis ma za zadanie zilustrować pewne subtelne różnice pomiędzy tymi trzema pakietami statystycznymi. Różnice o często niebagatelnych konsekwencjach. Wyobraźmy sobie, że podmiot X zleca nam budowę narzędzia analitycznego. Dochodzi do odbioru. Podmiot X sprawdza czy narzędzie liczy wszystko … Czytaj dalej R vs SAS vs SPSS