Zeitreihenanalyse mit R – Entscheidungsgrundlage und Potentialfaktor

This post was kindly contributed by eoda, R und Datenanalyse » R - go there to comment and to read the full post.

Prognosen über Börsenkurse, das Wetter oder die Arbeitslosenquote – täglich begegnen uns im Alltag Vorhersagen über zukünftige Ereignisse und Entwicklungen. In vielen Bereichen sind Vorhersagen zu wichtigen Grundlagen für unser Handeln geworden. Egal ob es um die Planung der Freizeitaktivitäten in Abhängigkeit der Wettervorhersage geht, oder um elementare wirtschaftliche Investitionsentscheidungen aufgrund von Konjunkturprognosen  –  Grundlage von Vorhersagemodellen sind Zeitreihenanalysen.

Graphische Veranschaulichung der Prognose über die Arbeitslosenzahl (in Mio.) in Deutschland (Datensatz: Quelle Eurostat  - Zur Verfügung gestellt von DataMarket).

Graphische Veranschaulichung der Prognose über die Arbeitslosenzahl (in Mio.) in Deutschland

Zeitreihenanalyse: Methoden und Ziele

Eine Zeitreihe beschreibt die Entwicklung von Daten deren Werte innerhalb eines festgelegten Zeitraums erfasst und visualisiert werden. Die Zeitreihenanalyse beruht auf der Vermutung, dass sich in dieser Reihe Regelmäßigkeiten entdecken lassen, die sich für Aussagen über die Abfolge und die weitere Entwicklung der Zeitreihe nutzen lassen. Neben der Verwendung von Zeitreihen als Instrument für Prognosen über Zukunftsszenarien dienen die Analysen noch für andere Zielsetzungen: Zeitreihenanalysen werden verwendet um historische Zeitreihen möglichst genau zu beschreiben, entscheidende Veränderungen zu erkennen und um langfristige Entwicklungen durch Bereinigung von saisonalen Konjunkturzyklen und Trenderscheinungen im Rahmen der Komponentenerkennung herauszuarbeiten. Diese Verfahren bilden dann wiederum auch die Grundlage für ein möglichst aussagekräftiges Prognosemodell.

Visualisierung einer Komponentenzerlegung am Beispiel der Arbeitslosenzahlen der Bundesrepublik Deutschland.

Visualisierung einer Komponentenzerlegung am Beispiel der Arbeitslosenzahlen der Bundesrepublik Deutschland.

Ereigniszeitanalyse als zeitliche Bestimmungsgröße

Ein zu den Zeitreihenanalysen verwandter Themenbereich ist die Event-History-Analysis, auch Ereigniszeitanalyse genannt. Die populärste Variante der Event-History Analysis ist die Survival-Analysis, in der eine genaue “time-to-event” Bestimmung prognostiziert wird. Dabei liegt der Fokus also auf der genauen Abschätzung eines Zeitraumes bzw. eines Zeitpunktes wann ein konkretes Ereignis eintritt. Die Anwendungsfelder sind auch hier vielfältig. In der Medizin werden solche Analysen beispielsweise eingesetzt um Krankheitsverläufe zu prognostizieren. Im technischen Kontext können Maschinenausfälle vorhergesagt werden und in Unternehmen werden Survival-Analysis unter anderem für eine bessere zeitliche Planung von Marketingaktivitäten genutzt. Das Handeln der Kunden wird vorhersehbarer:

  • Ein Mobilfunkanbieter kann abschätzen wann das Risiko besteht, dass ein Kunde seinen bestehenden Vertrag kündigt
  • Ein Automobilbauer kann anhand von Erfahrungswerten den Zeitraum ermitteln, in dem die Chance am größten ist, einem Bestandskunden zum Kauf eines neuen Fahrzeugs zu bewegen.
  • Der Anbieter von Versicherungen kann aufgrund der Lebenssituation und demografischer Faktoren potentieller Kunden erkennen zu welchem Zeitpunkt welches seiner Produkte das größte Interesse beim Kunden weckt.

Event-History-Analysis erbringen also einen Wissensvorsprung, der Unternehmen hilft vorhandene Ressourcen effektiver einzusetzen und somit echte Wettbewerbsvorteile zu erzielen

Vorteile der Zeitreihenanalyse mit R

Zeitreihenanalysen sind in der Regel äußerst komplex und oft mit großen Datenmengen verbunden. Die Open-Source Programmiersprache R ist im besonderen Maße für solche komplexen Analysen geeignet. Mit über 4.500 verfügbaren Erweiterungspaketen steht den Anwendern ein nahezu unbegrenztes Methodenset zur Verfügung, dass lizenzkostenfrei verfügbar ist. So bietet R auch für individuelle Aufgabenstellungen die passenden Tools zur Umsetzung. Interessant für die Umsetzung von Zeitreihenanalysen sind die äußerst flexiblen und qualitativ hochwertigen Visualisierungsmöglichkeiten von R. Beispielhaft dafür stehen die beiden Grafiken dieses Beitrags, die auf Basis eines von Datamarket zur Verfügung gestellten Eurostat Datensatzes erstellt wurden. Die stark wachsende Popularität und Verbreitung von R durch alle Anwendungsbereiche statistischer Analysen hinweg ist Beleg für die hervorragenden Möglichkeiten die R heute schon bietet, und durch die stetig wachsende Entwicklergemeinde auch in Zukunft bieten wird.

Zeitreihenanalyse im Rahmen der R-Akademie

Im Rahmen der R-Akademie von eoda, einem ganzheitlichen Trainingsprogramm für die Statistiksprache R bieten wir Anfang September den Kurs „Zeitreihenanalyse mit R“ an. Der Kurs verdeutlicht die Fähigkeiten und Potentiale, die R im Bereich der Zeitreihenanalyse bietet. Anhand von praxisnahen Beispielen werden die Anwendungen der Zeitreihenanalyseverfahren erlernt. Unter anderem sind folgende Methoden Teil des Kursprogramms:

  • Visualisierung von Zeitreihen
  • Kolomogorv Smirnov (KS-Test)
  • HoltWinters
  • Box-Jenkins
  • Forecasting
  • ARMA/ARIMA/SARIMA
  • Kaplan-Meier
  • Cox-Regression

Die R-Akademie verfolgt das Ziel, die Teilnehmer mit den Fähigkeiten auszustatten, das Gelernte selbstständig auf ihre individuellen Anwendungszwecke anwenden zu können. „Zeitreihenanalyse mit R“ findet am 4/5 September in unseren Räumen in Kassel statt. Für Interessierte ohne Vorkenntnisse in R bietet sich der Kurs „Einführung in R“ an, der am 2/3 September stattfindet und die Grundlagen von R vermittelt.