de
                    array(1) {
  ["de"]=>
  array(13) {
    ["code"]=>
    string(2) "de"
    ["id"]=>
    string(1) "3"
    ["native_name"]=>
    string(7) "Deutsch"
    ["major"]=>
    string(1) "1"
    ["active"]=>
    string(1) "1"
    ["default_locale"]=>
    string(5) "de_DE"
    ["encode_url"]=>
    string(1) "0"
    ["tag"]=>
    string(2) "de"
    ["missing"]=>
    int(0)
    ["translated_name"]=>
    string(7) "Deutsch"
    ["url"]=>
    string(74) "https://www.statworx.com/case-studies/skalierung-von-forecasting-modellen/"
    ["country_flag_url"]=>
    string(87) "https://www.statworx.com/wp-content/plugins/sitepress-multilingual-cms/res/flags/de.png"
    ["language_code"]=>
    string(2) "de"
  }
}
                    
Kontakt
Case Studies
Case Studies

Skalierung von Forecasting-Modellen

In diesem Projekt haben wir eine bestehende Model Factory zum Demand Forecasting von über 10.000 Entitäten parallelisiert in die IT-Infrastruktur unseres Kunden implementiert.

  • Branche Transport & Logistics
  • Thema Forecasting
  • Tools SQL, R
  • Projektdauer 1 Monat

Herausforderung

Die Entwicklung komplexer Machine Learning Modelle findet häufig in einer Sandbox, also in einer abgeschlossenen Entwicklungsumgebung statt. Nach dem erfolgreichen Test der Modelle werden diese anschließend in die vorhandene IT-Landschaft implementiert, um dort in regelmäßigen Zyklen ausgeführt zu werden. Unser Kunde, ein internationales Logistikunternehmen, stand vor der Herausforderung, dass die von ihm entwickelten Modelle zur Prognose des Nachfrageaufkommens für mehr als 10.000 Entitäten geschätzt werden mussten und unter dieser Voraussetzung eine tägliche Prognose nicht möglich schien.

Ansatz

Um die tägliche Rechenlast bewältigen zu können, haben wir für den Kunden zunächst ein eigenes R-Package entwickelt, das die nötigen Funktionen und Modelle beinhaltet. Dieses wird zentral verwaltet und gewartet. Im Anschluss daran haben wir einen automatisierten Prozess programmiert, der mittels Parallelisierung die über 10.000 Modelle gleichzeitig auf einer Multicore-Serverumgebung ausführt. Hierbei wurden mehrere Modelle gleichzeitig trainiert und lieferten Prognosen für die Nachfrage pro Kund:in für den nächsten Geschäftstag ab. Aufgrund der leistungsstarken Infrastruktur des Kunden konnten bis zu 20 Modelle parallel trainiert werden

Ergebnis

Auf Basis der parallelisierten Implementierung der Modelle kann unser Kunde nun täglich die Nachfrage aller für ihn relevanten Kund:innen und Entitäten vorhersagen. Durch die parallelisierte Durchführung der Modellschätzungen konnte die Rechenzeit um den Faktor 15 reduziert werden, was eine Schätzung aller Entitäten überhaupt erst möglich macht.

Experte

Kontakt anfragen

Erfahre mehr!

Als eines der führenden Unternehmen im Bereich Data Science, Machine Learning und KI begleiten wir Sie in die datengetriebene Zukunft. Erfahren Sie mehr über statworx und darüber, was uns antreibt.
ÜBER UNS