Tag Archive for R

fuzzycheKc – Erkennung von ähnlichen Daten

Lösung zur Steigerung der Datenqualität Vollautomatisches Erkennen von Duplikaten und ähnlichen Einträgen Vollständige Integtation in bestehende Systeme Datenqualität hat eine hohe Relevanz für viele IT-Systeme wie CRM- oder ERP-Systeme. Richtige, vollständige und aktuelle Daten sind essentiell für erfolgreiche operative Prozesse. … Weiterlesen

Annotare gli oggetti in R

Gli oggetti di R di per sè non sono annotati, mentre spesso è utile avere delle informazioni accessorie, come ad esempio la provenienza o l’autore dei dati, caratteristiche e significato delle variabili e dei loro valori, problemi esistenti, av…

Kampania Wrześniowa

Przez wrzesień na blogu pojawi kilka wpisów w nowej formule, nazwijmy ją roboczo ,,wtorek bawi, czwartek uczy”. O co chodzi? Eksperymentalnie, przez wrzesień we wtorki będę pokazywał wyniki pewnych analiz, a w czwartki pokuszę się o techniczny komentarz jak ta ilustracja została wykonana i dlaczego użyłem akurat tych a nie innych technik. Postaram się by [...]

Olimpiada, Twitter a geolokalizacja*

Dzisiaj przedstawię wizualizację danych dotyczących letnich igrzysk olimpijskich w Londynie pobranych publicznie dostępnym API Twittera. Jest to trzecia wizualizacja prezentowana na tym blogu, która powstała na bazie Twittera i dotyczy sportu. Poprzednie dwie były o Premier League i Euro 2012. Podobnie jak poprzednie, również ta została wykonana w oddziale Netezza IBM Polska i jest ze [...]

Grouped forest plots using ggplot2

I decided to write this post in English, as I need to practice in writing more. As I currently do some meta-analytic stuff, I needed to get a proper plot of the results of analysis. The existing solutions are hard to customize, so I decided to do something by myself. Basically, the forest plot is [...]