Polish

Różnorodność ćwierkań polityków na Twitterze

February 22, 2012
By
Różnorodność ćwierkań polityków na Twitterze

Czas na zakończenie tematu analizy tekstów z twittera i powrót do raportów. Na koniec przyjrzymy się jeszcze dwóm tematom. Jak zróżnicowane słownictwo znaleźć można we wpisach rożnych polityków, oraz jak często politycy piszą o swoich i nie swoich partiach. Ale najpierw krótkie wprowadzenie. Wczoraj obchodziliśmy Międzynarodowy Dzień Języka Ojczystego (btw: nie należy mylić tego...

Read more »

Flaszki i Studencki Festiwal Informatyczny

February 21, 2012
By
Flaszki i Studencki Festiwal Informatyczny

W najbliższym miesiącu opowiem coś na dwóch imprezach, które mają bardzo ciekawą formę. Dziś napiszę kilka zdań o obu imprezach i też powiem o czym będę na nich mówił. Pierwsza  z imprez ma miejsce w Warszawie, druga w Krakowie. Warszawska nazywa się Flaszki. Link do strony imprezy znajduje się tutaj. Organizowana jest przez samorząd...

Read more »

Aktywność polityków na Twitterze a Sherlock Holmes

February 20, 2012
By
Aktywność polityków na Twitterze a Sherlock Holmes

Zacznę od krótkiego wyjaśnienia skąd pomysł na ten wpis. W komentarzach do piątkowego wpisu użytkownik @Maciej podał odnośnik do przykładowej analizy danych z Twittera z popularnego agregatu blogów o R, czyli R-bloggers. W odpowiedzi na ten komentarz użytkownik @mw zrobił mini profilowanie Martina, użytkownika, którego wpisy przedstawiono w tej przykładowej analizie. Hmmmm, może z...

Read more »

Piątek, chmura słów, TextMining, morfologik i oczywiście R

February 17, 2012
By
Piątek, chmura słów, TextMining, morfologik i oczywiście R

Dzisiaj jest piątek, więc zamiast zaprzątać sobie głowę liczbami pooglądamy obrazki. Dwa dni temu, w tym wpisie opisałem jak ściągnąć dane z Twittera i jako przykład ściągnąłem dane z kanału #debataACTA. Pokazałem też kilka podsumowań odkładając na później bardziej złożone analizy. Analizę nastawienia odłożę jeszcze na później, a dzisiaj pokażę jak danych tekstowych zrobić chmurę słów...

Read more »

#debataACTA, twitteR, Twitter i R

February 15, 2012
By
#debataACTA, twitteR, Twitter i R

Zaczęło się niewinnie. Dwa tygodnie temu kolega Grzesiek P. powiedział, że analizę nastawienia (ang. Sentiment analysis) na dużych ilościach tekstu robi się banalnie. Tydzień temu kolega Paweł Ch. powiedział, że API twittera ma limit do 70 zapytań na minutę. W piątek przy okazji rozmowy o raporcie ,,Obiegi Kultury” Alek T. zapytał mnie czy mam doświadczenie w...

Read more »

Prosty pająk sieciowy, czyli parsowanie stron internetowych, część 2

February 1, 2012
By

Jakiś czas temu we wpisie ,,Prosty pająk sieciowy‘’ (link tutaj) przedstawiłem połączenie skryptu w Perlu i skryptu w R, które wykorzystywałem do zbierania danych o samochodach z serwisu otomoto.pl. W komentarzach do wpisu użytkownik Maciej opisał podobne rozwiązanie, ale zamiast skryptu w Perlu wykorzystujące pakiet XML (dostępny dla programu R w repozytorium CRAN). Rozwiązanie Maćka...

Read more »

The New York Times, data journalism, R i wynagrodzenia

January 27, 2012
By
The New York Times, data journalism, R i wynagrodzenia

Na blogu firmy RevolutionAnalytics znalazłem ciekawy wpis o tym jak edytor z NYT użył pakietu maptools dla R aby przedstawić graficznie mapę 99% centyla dochodów w poszczególnych rejonach stanów zjednoczonych. Innymi słowy mapę mówiącą ile trzeba zarabiać by być w lokalnej grupie 1% najbogatszych (co kraj to problem). Wspomniany edytor prowadzi bloga (link tutaj) i na...

Read more »

Polska Grupa Użytkowników programu R

January 24, 2012
By

Kilka dni temu założyłem na google groups Polską Grupę Użytkowników R. Grupa jest otwarta, nie ma moderacji, każdy może się zapisać i wysłać wiadomość do pozostałych zapisanych. Link do grupy http://groups.google.com/group/polska-grupa-uzytkownikow-r W założeniu grupa miała ułatwić mi informowanie uczestników poprzednich WZURów o kolejnych spotkaniach tego typu. Ale jak dotąd na grupie pojawiły się już...

Read more »