Author Archive for Heiko Miertzsch

Neue Lösung für Marktforscher: Ein Klick vom Fragebogen zum Tabellenband

Der gesamte Prozess der Datenerhebung ohne Medienbrüche Komfortable Erstellung benutzerdefinierter Tabellen mit vielen Konfigurationsmöglichkeiten Integration der Statistik-Sprache R mit über 4.500 Erweiterungspaketen zur Datenanalyse Vielfältige Exportfunktionen in alle gängigen Formate Mit tableR hat eoda heute auf der „useR!“ Konferenz im spanischen Albacete, der weltweit größten Konferenz für die Statistiksprache R, eine neue Software zur komfortablen [...]

SAS hat einen neuen Vergleich von SAS und R veröffentlicht

Unter dem Titel Big Data Analytics: Benchmarking SAS, R and Mahout. hat SAS am 26. April auf der SAS-Webseite einen Vergleich von SAS, R und Apache Mahout veröffentlicht. In einem zweiteiligen Blog-Beitrag setzt sich Thomas Dinsmore, Director of Product Management bei Revolution Analytics , kritisch mit dem Text auseinander. Der erste Teil beschäftigt sich mit [...]

Data Mining mit R – Kurs im Mai

Data Mining steht für das hypothesenfreie Extrahieren von  Erkenntnissen aus Daten. Statistische und mathematische Verfahren werden auf Datenbestände angewendet, um bestehende Muster und Zusammenhänge aufzudecken. Data Mining Verfahren stellen i.d.R. geringe Anforderung an das Meßniveau der Daten (kategorial, ordinal, metrisch) … Weiterlesen

BigData auf Hadoop mit R analysieren

Mit den R-Paketen von Revolution Analytics lassen sich MapReduce-Algorithmen für verteilte Daten in einem Hadoop Cluster entwickeln und anwenden Seit die Meta Group 2001 das erste Mal von BigData sprach, werden immer wieder drei Aspekte genannt, die „BigData“ ausmachen: Die … Weiterlesen

Eine kurze Geschichte über R

Schlagworte wie Big Data oder Data Mining erfahren zur Zeit eine besondere Aufmerksamkeit. Sie sind Ausdruck des Trends, Daten als wertvollen Rohstoff zu begreifen. IT-Systeme in Unternehmen produzieren jeden Tag riesige Datenmengen. Praktisch alle Unternehmensteile wie Einkauf, Produktion, Administration und Verkauf … Weiterlesen

fuzzycheKc – Erkennung von ähnlichen Daten

Lösung zur Steigerung der Datenqualität Vollautomatisches Erkennen von Duplikaten und ähnlichen Einträgen Vollständige Integtation in bestehende Systeme Datenqualität hat eine hohe Relevanz für viele IT-Systeme wie CRM- oder ERP-Systeme. Richtige, vollständige und aktuelle Daten sind essentiell für erfolgreiche operative Prozesse. … Weiterlesen