de
                    array(1) {
  ["de"]=>
  array(13) {
    ["code"]=>
    string(2) "de"
    ["id"]=>
    string(1) "3"
    ["native_name"]=>
    string(7) "Deutsch"
    ["major"]=>
    string(1) "1"
    ["active"]=>
    string(1) "1"
    ["default_locale"]=>
    string(5) "de_DE"
    ["encode_url"]=>
    string(1) "0"
    ["tag"]=>
    string(2) "de"
    ["missing"]=>
    int(0)
    ["translated_name"]=>
    string(7) "Deutsch"
    ["url"]=>
    string(72) "https://www.statworx.com/case-studies/anomalieerkennung-in-retail-daten/"
    ["country_flag_url"]=>
    string(87) "https://www.statworx.com/wp-content/plugins/sitepress-multilingual-cms/res/flags/de.png"
    ["language_code"]=>
    string(2) "de"
  }
}
                    
Kontakt
Case Studies
Case Studies

Anomalieerkennung in Retail-Daten

Zur Sicherstellung einer optimalen Datenqualität haben wir für unseren Retail-Kunden ein Modell entwickelt, das ungewöhnliche Datenpunkte in Sales-Daten automatisch erkennt und korrigiert.

  • Branche Retail & Consumer
  • Thema Anomaly Detection
  • Tools Teradata, SQL, R
  • Projektdauer 1 Monat

Herausforderung

Optimal aufbereitete Daten stellen die Grundlage für alle Fragestellungen im Bereich Analytics, Reporting und Data Science dar. Häufig müssen Daten vor der eigentlichen Auswertung aufwändig aufbereitet und bereinigt werden. Unser Kunde, ein internationales Retail-Unternehmen, wollte täglich eine vollautomatische Verifizierung und Bereinigung der Sales-Daten angeschlossener Filialen durchführen, um darauf aufbauende Reporting-Systeme fehlerfrei bereitstellen zu können.

Ansatz

Basierend auf den Sales-Zeitreihen der letzten zwei Jahre (etwa 500 Millionen Datenpunkte) entwickelten wir gemeinsam mit dem Kunden ein statistisches Modell, das pro Produkt-Filial-Kombination die tatsächliche mit der empirisch beobachteten Verteilung der jeweiligen KPI abgleicht und so auffällige Datenpunkte vollautomatisch erkennen kann. Weiterhin ist das Modell dazu in der Lage, Anomalien in den Daten auf die durch das Modell erwarteten Werte zu glätten, um die jeweilige Beobachtung nicht vollständig löschen zu müssen. Der Algorithmus wurde vollständig in R entwickelt und auf dem vorhandenen Analytics-Server innerhalb einer Datenbank produktiv geschaltet.

Ergebnis

Seit dem Deployment erkennt das Modell täglich Anomalien und auffällige Datenpunkte vollautomatisch. Durch die Anwendung des Modells ist es erstmalig gelungen, eine automatische Datenaufbereitung und Bereinigung der täglich angelieferten Filialdaten zu implementieren, die zuverlässige und stabile Ergebnisse liefert. Zudem fallen durch die Open Source Software R keine Lizenzkosten an.

Experte

Kontakt anfragen

Erfahre mehr!

Als eines der führenden Unternehmen im Bereich Data Science, Machine Learning und KI begleiten wir Sie in die datengetriebene Zukunft. Erfahren Sie mehr über statworx und darüber, was uns antreibt.
ÜBER UNS