Polish

Klasyfikacja i regresja z pakietem caret – ściągawka

Pakiet caret (akronim od Classification And REgression Training) to świetne narzędzie do budowy modeli, testowania, wyboru zmiennych i innych zadań często wykonywanych do analizy danych. W ramach zaliczenia przedmiotu Data Mining dwie osoby przygotowały dwie ściągawki z funkcjonalności tego pakietu. Obie poniżej. Wersje pdf można pobrać po kliknięciu. Dwustronicowe opracowanie przygotowane przez Neven Piculjan. I … Czytaj dalej Klasyfikacja i regresja z pakietem caret – ściągawka

[R + finanse]: Jak przedstawiać zależność między zmiennymi losowymi? (3)

Marcin Pitera Dzisiaj bardziej ogólnostatystyczny wpis, choć nie bez znaczenia dla matematyki finansowej. Załóżmy, iż mamy dany n-wymiarowy wektor losowy i chcemy opisać (czy zobrazować) zależność między zmiennymi brzegowymi, tzn. zmiennymi losowymi . Oczywiście w przypadku matematyki finansowej zagadnienie to jest bardzo istotne. Na przykład informacja o zależności między akcjami pozwala nam na konstruowanie zdywersyfikowanych portfeli … Czytaj dalej [R + finanse]: Jak przedstawiać zależność między zmiennymi losowymi? (3)

EksploRacja danych z krokomierza

Dobrze mieć szwagra. Ostatnio dowiedziałem się od niego, że telefony appla wersji 5s i wyżej, mają koprocesor ruchu. Nic nie trzeba włączać, a on (telefon, nie szwagier) non stop liczy kroki, dystans itp. (o ile oczywiście ma się telefon przy sobie). To czy i od kiedy liczy, można sprawdzić w aplikacji Health. Poniżej zobaczymy jak … Czytaj dalej EksploRacja danych z krokomierza

SER XV – duuuużo R + elastic i pivotTable

W czwartek o godzinie 18, na MINI PW (Warszawa Koszykowa 75 sala 329), zaczynamy piętnasty SER. Tym razem mamy dwóch prelegentów z Wirtualnej Polski. Dostałem informację, że przed przerwą zimową (w lutym SERa nie będzie) mają zamiar pokazać nam bardzo dużo eRa na żywo. Na spotkanie można się zapisać przez stronę meetup (na obecną chwilę … Czytaj dalej SER XV – duuuużo R + elastic i pivotTable

Czy przekroczą 55 milionów?

Już jutro finał 24. Wielkiej Orkiestry Świątecznej Pomocy. Z roku na rok WOŚP zbiera coraz więcej środków, w tym roku na wsparcie oddziałów pediatrycznych i opieki medycznej seniorów. Jak myślicie ile pieniędzy uda się zebrać? Zobaczmy co na ten temat mają do powiedzenia modele liniowe Dane n.t. kwot zebranych podczas kolejnych finałów pobieramy z Wikipedii. … Czytaj dalej Czy przekroczą 55 milionów?

Tabela 1 a pakiet Gmisc

Tworząc raporty często początkowe tabele są do siebie podobne – przedstawiają statystyki opisowe zmiennych. Bardziej złożone statystyki są zazwyczaj później. W przypadku prac bio-medycznych używa się sformułowania Tabela 1 – czyli pierwsza tabela w artykule, zazwyczaj przedstawiająca statystyki opisowe porównywanych grup (np terapia A/B/C). Ostatnio odkryłem pakiet Gmisc – fantastyczne wsparcie do szybkiego tworzenia (dobrze … Czytaj dalej Tabela 1 a pakiet Gmisc

[R + finanse]: Co to są stopy zwrotu i jak testować ich normalność? (2)

Kontynuujemy serię gościnnych wpisów na temat ,,R i finanse”. W tym wpisie zajmiemy się podstawowymi metodami przetwarzania danych finansowych. W szczególności pokażemy jak, mając dane ceny zamknięcia, konstruować proste i logarytmiczne stopy zwrotu oraz jak testować ich normalność. Marcin Pitera Używając funkcji yahooSeries, wczytajmy dane dzienne dla AAPLE (Apple), MSFT (Microsoft) oraz CSCO (Cisco) w okresie od … Czytaj dalej [R + finanse]: Co to są stopy zwrotu i jak testować ich normalność? (2)

Godziny głosowań w sejmie VII i VIII kadencji

Późno chodzę spać i często przed snem sprawdzam wiadomości (złe nawyki, może w 2016 się ich pozbędę). Pomimo tych późnych godzin, czasem rano z zaskoczeniem odkrywam, że w międzyczasie w Sejmie uchwalono nową ustawę (o wieku rozpoczęcia szkoły jeszcze napiszę w osobnym poście). Czy zmieniły się godziny pracy Sejmu? Do której godziny w Sejmie teraz … Czytaj dalej Godziny głosowań w sejmie VII i VIII kadencji