Blog Archives

Ceny używanych aut po raz trzeci

March 23, 2012
By

  W październiku poprzedniego roku i 1 stycznia tego roku zebrałem na bazie serwisu www.otomoto.pl zbiór opisujący cen i wiele dodatkowych parametrów z ofert sprzedaży samochodów używanych (zobacz między innymi te wpisy). Dzisiaj dodaję zbiór danych o cenach samochodów z połowy marca roku 2012. Na podstawie tych trzech pomiarów będziemy mogli się przyjrzeć temu...

Read more »

Konkurs i V Zlot użytkowników R (WZUR) w Warszawie już 1 marca!!!

February 29, 2012
By
Konkurs i V Zlot użytkowników R (WZUR) w Warszawie już 1 marca!!!

W najbliższy czwartek (1 marca) na wydziale Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego (Banacha 2) w sali 2180 (to duża sala przy schodach na 1 piętrze), odbędzie się piąte spotkanie użytkowników R z serii WZUR. Plan spotkania jest następujący: 16:30 – 17:00 – swobodne rozmowy, 17:00 – 17:30 – Grzesiek Maj opowie o obliczeniach...

Read more »

Różnorodność ćwierkań polityków na Twitterze

February 22, 2012
By
Różnorodność ćwierkań polityków na Twitterze

Czas na zakończenie tematu analizy tekstów z twittera i powrót do raportów. Na koniec przyjrzymy się jeszcze dwóm tematom. Jak zróżnicowane słownictwo znaleźć można we wpisach rożnych polityków, oraz jak często politycy piszą o swoich i nie swoich partiach. Ale najpierw krótkie wprowadzenie. Wczoraj obchodziliśmy Międzynarodowy Dzień Języka Ojczystego (btw: nie należy mylić tego...

Read more »

Flaszki i Studencki Festiwal Informatyczny

February 21, 2012
By
Flaszki i Studencki Festiwal Informatyczny

W najbliższym miesiącu opowiem coś na dwóch imprezach, które mają bardzo ciekawą formę. Dziś napiszę kilka zdań o obu imprezach i też powiem o czym będę na nich mówił. Pierwsza  z imprez ma miejsce w Warszawie, druga w Krakowie. Warszawska nazywa się Flaszki. Link do strony imprezy znajduje się tutaj. Organizowana jest przez samorząd...

Read more »

Aktywność polityków na Twitterze a Sherlock Holmes

February 20, 2012
By
Aktywność polityków na Twitterze a Sherlock Holmes

Zacznę od krótkiego wyjaśnienia skąd pomysł na ten wpis. W komentarzach do piątkowego wpisu użytkownik @Maciej podał odnośnik do przykładowej analizy danych z Twittera z popularnego agregatu blogów o R, czyli R-bloggers. W odpowiedzi na ten komentarz użytkownik @mw zrobił mini profilowanie Martina, użytkownika, którego wpisy przedstawiono w tej przykładowej analizie. Hmmmm, może z...

Read more »

Piątek, chmura słów, TextMining, morfologik i oczywiście R

February 17, 2012
By
Piątek, chmura słów, TextMining, morfologik i oczywiście R

Dzisiaj jest piątek, więc zamiast zaprzątać sobie głowę liczbami pooglądamy obrazki. Dwa dni temu, w tym wpisie opisałem jak ściągnąć dane z Twittera i jako przykład ściągnąłem dane z kanału #debataACTA. Pokazałem też kilka podsumowań odkładając na później bardziej złożone analizy. Analizę nastawienia odłożę jeszcze na później, a dzisiaj pokażę jak danych tekstowych zrobić chmurę słów...

Read more »

#debataACTA, twitteR, Twitter i R

February 15, 2012
By
#debataACTA, twitteR, Twitter i R

Zaczęło się niewinnie. Dwa tygodnie temu kolega Grzesiek P. powiedział, że analizę nastawienia (ang. Sentiment analysis) na dużych ilościach tekstu robi się banalnie. Tydzień temu kolega Paweł Ch. powiedział, że API twittera ma limit do 70 zapytań na minutę. W piątek przy okazji rozmowy o raporcie ,,Obiegi Kultury” Alek T. zapytał mnie czy mam doświadczenie w...

Read more »

Prosty pająk sieciowy, czyli parsowanie stron internetowych, część 2

February 1, 2012
By

Jakiś czas temu we wpisie ,,Prosty pająk sieciowy‘’ (link tutaj) przedstawiłem połączenie skryptu w Perlu i skryptu w R, które wykorzystywałem do zbierania danych o samochodach z serwisu otomoto.pl. W komentarzach do wpisu użytkownik Maciej opisał podobne rozwiązanie, ale zamiast skryptu w Perlu wykorzystujące pakiet XML (dostępny dla programu R w repozytorium CRAN). Rozwiązanie Maćka...

Read more »