Olimpiada, Twitter a geolokalizacja*

Dzisiaj przedstawię wizualizację danych dotyczących letnich igrzysk olimpijskich w Londynie pobranych publicznie dostępnym API Twittera. Jest to trzecia wizualizacja prezentowana na tym blogu, która powstała na bazie Twittera i dotyczy sportu. Poprzednie dwie były o Premier League i Euro 2012. Podobnie jak poprzednie, również ta została wykonana w oddziale Netezza IBM Polska i jest ze […]

笨办法学R编程(5)

随着教程推进,基本的语法都接触得差不多了。当要解决某个具体问题时,只需要考虑用什么样的算法来整合运用这些函数和表达式。今天来解决Project Euler的第五个问题,该问题可以用很笨

笨办法学R编程(4)

看到各位对“笨办法系列”的东西还比较感兴趣,我也很乐意继续写下去。今天的示例将会用到数据框(data.frame)这种数据类型,并学习如何组合计算两个向量,以及如何排序。我们将用所

Aihepiirianalyysi kansanedustajien puheista

Hesari ja Kansan muisti julkaisivat keväällä mielenkiintoisen kansanedustajien puheista koostetun datasetin. Datan perusteella syntyikin useita mielenkiintoisia visualisointeja osana HS Open 4  -tapahtumaa.  Näin laaja aineisto tarjoaa myös mainion mahdollisuuden kokeilla aihepiirianalyysiä (engl. topic model). Se on tilastollinen koneoppimismenetelmä, jolla laajoista tekstidokumenttikokoelmista voidaan etsiä toistuvia aihepiirejä … Lue loppuun

笨办法学R编程(3)

经历了前面两个小挑战,你应该对R有点理解了。我们继续推进,今天的问题有点点复杂,复杂的不是R,而是一个数学概念:质数和质因子。任何一个合数都可以被几个质数所分解,这个性质