Polish

geom_christmas_tree(): a new geom for ggplot2 v2.0

Version 2.0 of the ggplot2 package (on GitHub) has a very nice mechanism for adding new geoms and stats (more about it here). Christmas are coming, so maybe one would like to make his plots more tree’ish? Below you will find a definition of geom_christmas_tree() geom. It supports following aesthetics: size (number of segments), fill, … Czytaj dalej geom_christmas_tree(): a new geom for ggplot2 v2.0

[R + finanse]: Jak wczytywać i prezentować dane giełdowe? (1)

Dziś na blogu gościnny wpis przygotowany przez Marcina Piterę. Jest to mam nadzieję, że pierwszy z serii wpisów opisujących przystępnie interesujące zagadnienia związane z analizą danych. W tym przypadku finansowych. Marcin Pitera Cześć! W najbliższym czasie przedstawię wam serię wpisów, które pokażą, jak używać R w w kontekście danych finansowych, matematyki finansowej, czy analizy ilościowej. … Czytaj dalej [R + finanse]: Jak wczytywać i prezentować dane giełdowe? (1)

SupER notes za (pod?) choinkę

Zbliżają się święta, czas pomyśleć o choince. A że za trzy dni kolejny SER, więc ogłaszamy konkurs na SupERową choinkę! (dla inspiracji: rok temu na blogu pokazywaliśmy jak zrobić choinkę w shiny) Zasady są proste. Trzeba wysłać do poniedziałku 21 grudnia (tydzień czasu, można wysyłać do końca dnia) choinkę wykonaną w R. Zresztą, bądźmy otwarci. … Czytaj dalej SupER notes za (pod?) choinkę

Czy Internet pozwala przewidzieć wyniki wyborów?

Dziś mamy gościnny wpis poświęcony analizie danych wyborczych a na wtorek mamy zaplanowany gościnny wpis poświęcony analizie danych finansowych. Dzisiejszy wpis przygotował dr Albert Hupa z IRCenter i są do niego dołączone dane z sondaży wyborczych, z Google Trends, z wypowiedzi na mediach społecznościowych, oraz badania CAWI wśród internautów. Dane z różnych źródeł, można trochę … Czytaj dalej Czy Internet pozwala przewidzieć wyniki wyborów?

GeCONiI – jak budować pakiety, reprodukowalne raporty i aplikacje webowe w R

W poprzednim tygodniu miałem przyjemność prowadzić szkolenie dotyczące różnych ciekawych inżynierskich aspektów programowania w R. Szkolenie było prowadzone dla Akademii GeCONiI na Politechnice Śląskiej. Dzięki uprzejmości organizatorów mogę podzielić się materiałami ze szkolenia. Całość jest dostępna na stronie GitHub a poszczególne tematy można znaleźć pod poniższymi linkami * Budowa pakietów z użyciem devtools * Odtwarzalne … Czytaj dalej GeCONiI – jak budować pakiety, reprodukowalne raporty i aplikacje webowe w R

Eseje i SERy

Dzisiejszy wpis to cztery splatające się wątki. Nie ma brzydkich danych – są tylko źle ubrane Kilkanaście osób wzięło udział w ogłoszonym w zeszłym tygodniu konkursie na hasło reklamujące Eseje. Dwa hasła, które najbardziej przypadły mi do gustu, to ,,Nie ma brzydkich danych – są tylko źle ubrane” i ,,Kto czyta eseje, Ten wody nie … Czytaj dalej Eseje i SERy

Hack the Proton. A data-crunching game from the Beta and Bit series

I’ve prepared a short console-based data-driven R game named ,,The Proton Game’’. The goal of a player is to infiltrate Slawomir Pietraszko’s account on a Proton server. To do this, you have to solve four data-based puzzles. The game can be played by beginners as well as heavy users of R. Survey completed by people … Czytaj dalej Hack the Proton. A data-crunching game from the Beta and Bit series

eXtreme Gradient Boosting vs Random Forest [i pakiet caret]

Drzewa decyzyjne są urocze. Można je wizualizować, łatwo wyjaśnić, łatwo stosować, łatwo nawet się je konstruuje. Ale niestety są niestabilne i nie nadają się do klasyfikacji danych o bardzo wysokim wymiarze i silnie skorelowanych zmiennych. Ale i z niestabilnością drzew można walczyć. Jedna z popularniejszych metod stabilizacji poszczególnych drzew to lasy losowe (drzewa budowane na … Czytaj dalej eXtreme Gradient Boosting vs Random Forest [i pakiet caret]