Author Archive for smarterpoland

R i SupER SER

W czwartek kolejny (po zimowej przerwie) SER z żywymi prelegentami. Pojawiają się nowe pomysły na imprezy stowarzyszone wokół SERa (o czym więcej niedługo). Jest to też dobra chwila na odświeżenie znaku graficznego. A ponieważ jak przystało na ludzi pracujących na co dzień z danymi jesteśmy ,,data-driven”, stąd krótka ankieta. Co myślicie o tej propozycji? Ładowanie…

Dzień liczby PI

Dzisiaj jest dzień liczby Pi, w zapisie miesiąc dzień rok: 3.14.15. Na Pogromców przez pierwsze 24 godziny zapisało się 314 osób. Przypadek?

PogromcyDanych, czyli +60 do Data Science skills

Coraz częściej można usłyszeć głosy, o tym jak to bardzo potrzebne są osoby potrafiące analizować dane (ostatnio tutaj, lata temu tutaj). Ale gdzie się nauczyć analizy danych? Samoucy sami wygrzebią w Internecie strzępki wiedzy z forów, grup dyskusyjnych, blogów czy innych źródeł. Łatwiej to przychodzi gdy ma się doświadczenie w programowaniu. Jest jednak rzesza osób, […]

R, rvest i web-harvesting

Źródło flickr Wyciąganie danych z treści stron internetowych to źródło interesujących informacji. Kiedyś wymagało to sporo samozaparcia i pokracznych skryptów w Perlu walczących z bałaganiarskimi źródłami stron internetowych. Dzisiejsze strony internetowe coraz częściej są zgodne ze standardami, jest też coraz więcej cywilizowanych narzędzi do ich parsowania. Ostatnio moją olbrzymią sympatię zyskał pakiet rvest pozwalający na […]

SER VIII – Modelowanie elastyczności cenowych i Programowanie obiektowe w R5 na przykładzie wyceny nieruchomości

Wracamy do spotkań SERowych z żywymi prelegentami. Najbliższe spotkanie 19 marca, zaczynamy o 18:00 od prezentacji, ‚Modelowanie elastyczności cenowych przy użyciu pakietu systemfit’ którą przedstawi Olga Mierzwa. Druga prezentacja rozpocznie się o 19:00, tytuł referatu to ‚Programowanie obiektowe w R5 na przykładzie wyceny nieruchomości’ a prowadzącą będzie Teresa Ponikowska. Pomiędzy prezentacjami będzie ciepły posiłek i […]

Canonical Discriminant Analysis a wykresy HE (***)

Tydzień temu pisaliśmy o wielowymiarowych modelach liniowych. Rozważaliśmy zagadnienie w którym k wymiarowy wektor zmiennych objaśnianych jest różnicowany przez zmienną grupującą. Aby ocenić czy istnieje jakaś zależność patrzymy na macierze E i H (patrz poprzedni wpis). Problem, który nam pozostał to fakt, że zmienna objaśniana ma k wymiarów a więc i macierze efektów E i […]

Wykresy HE (***)

(Kierując się sugestiami z maili, trudniejsze techniczne wpisy oznaczać będę gwiazdkami w tytule) GPS w domowych zastosowaniach pozwala kierowcom ominąć korki, ale w bardziej przemysłowych zastosowaniach pozwala na zarządzanie flotą pojazdów lub sterowanie bojowym dronem. Podobnie jest i z wizualizacją. Słupki i kropki można wykorzystać by pokazać kilka średnich ale istnieją też dla nich bardziej […]

Czy ,,Friends” są istotnie lepsi niż ,,Breaking Bad”? Test dwóch grup na przykładzie IMDB

Tydzień temu pokazywałem aplikację pozwalającą na analizę trendu w ocenach seriali telewizyjnych. Aplikacja powstała by z jej pomocą omawiać regresję liniową. Dzisiaj kontynuujemy temat. Poniżej można pobawić się aplikacją pozwalającą na porównanie średnich ocen dwóch różnych seriali. Czy Friends są wyżej oceniani niż Breaking Bad? I czy ta różnica jest istotna statystycznie? Aby odpowiedzieć na […]