Herausforderung
Die Vorhersage von Zeitreihen ist einer der am häufigsten anzutreffenden Use Cases im Data Science Bereich. Eine Vielzahl von Daten weisen eine zeitliche Ordnung auf, die durch die Anwendung entsprechender Modelle zur Prognose genutzt werden kann. Trotz der Heterogenität von Zeitreihendaten ist der Prozess der Analyse und Prognose meistens sehr ähnlich – und vergleichsweise aufwändig. Unser Kunde, ein internationaler Automobilhersteller, sah sich mit der Problematik konfrontiert, viele unterschiedliche Zeitreihen vorhersagen zu müssen.
Ansatz
Die korrekte Vorhersage von Zeitreihen ist methodisch anspruchsvoll und erfordert verschiedene, aufeinander aufbauende Schritte: Aufbereitungen der Rohdaten (zum Beispiel Entfernen von Ausreißern, Erkennen struktureller Brüche), Erstellung einer Auswahl informativer Einflussfaktoren (auch Feature Engineering und Feature Selection genannt), Training und Selektion von verschiedenen Zeitreihen- oder Machine Learning Modellen (etwa ARIMA(X), lineare oder baumbasierte Verfahren) sowie Validierung und Interpretation der resultierenden Modelle. Alle zuvor genannten Schritte haben wir für unseren Kunden im Rahmen der Entwicklung einer standardisierten Forecasting Engine gelöst. Diese kann nun automatisiert und skalierbar auf beliebig viele Forecasting-Problemstellungen angewendet werden.
Ergebnis
Durch die komplette Automatisierung des Modellierungsprozesses konnte die Zeit, die zur Entwicklung eines ersten Modells benötigt wird (Time-to-Model) auf ein absolutes Minimum reduziert werden. Unser Kunde wurde dadurch in die Lage versetzt, in kürzester Zeit eine Reihe anspruchsvoller Forecasting Use Cases umsetzen zu können.