数据挖掘的三行俳句

最近才看到Tom Khabaza写的一篇很有份量的文章,阐述了数据挖掘的九大法则,在最后他以俳句方式进行了总结,可谓是字字珠玑。原文很长,只将俳句和各法则的纲要翻译放在这里。First the bus…

Matematyka, PISA, zajęcia z modeli liniowych i mieszanych

Dziś mamy kolejny gościnny wpis. Tym razem poświęcony analizie danych PISA pod kątem cech korelujących z wynikami testu z matematyki. Dane PISA to źródło wielu ciekawych informacji, pracowaliśmy z nimi podczas poprzednich wakacji z wolontariuszami i będziemy jeszcze nie raz z nimi pracować. Zanim przejdę do gościnnego wpisu streszczę historię jego powstania. Wiem, że wśród [...]

Piramida wieku w Polsce a projekt kubek

I dziś ponownie wrócimy do projektu kubek, czyli jak mieć pod ręką różne charakterystyki związane z Polską (więcej informacji tutaj). Dzisiaj napiszę o tym jak powstawał wykres przedstawiający strukturę wieku w Polsce. Będzie technicznie, będzie kod w R, będzie o kolorach, będzie ciekawie! Dane Najlepszym (najbardziej wiarogodnym) źródłem danych o strukturze wieku wydawały się dane [...]

L’évaporation académique : les qualifiés non postulants

Je vais parler ici de l’évaporation académique, c’est à dire des personnes qui, qualifiées par le Conseil national des universités, ne candidatent à aucun poste universitaire. Je vais m’appuyer sur les données des “DGRH A / LT & DGRH A1-1 / PR”. Dans l’Etude de la promotion 2012 des qualifiés aux fonctions de MCF et [...]

Kto w Sejmie mówi w sposób prosty, a kto w złożony

Jakiś czas temu natrafiłem na opis indeksu czytelności Flescha. To współczynnik przyjmujący wartości od 0 do 100 opisujący stopień złożoności angielskiego tekstu. Im czytelniejszy tekst tym wyższa wartość tego indeksu. Współczynnik użyteczny, jeżeli chce się pisać prostym, czytelnym językiem. Pozwala na proste mierzenie czytelności własnych tekstów. Indeks Flescha wyznacza się w dosyć prosty sposób, na [...]