Zurück zu allen Blogbeiträgen

Machine Learning Goes Causal I: Warum Kausalität wichtig ist

  • Artificial Intelligence
  • Machine Learning
  • Statistics & Methods
29.01.2020
·

Team statworx

Bei statworx freuen wir uns darüber, dass sich in den letzten Jahren ein vielversprechendes neues Feld im Bereich des Machine Learnings entwickelt hat: Causal Machine Learning. Kurz gesagt, befasst sich Causal Machine Learning mit der wissenschaftlichen Erforschung von Machine-Learning-Algorithmen, die es ermöglichen, kausale Effekte zu schätzen.

In den vergangenen Jahren wurden verschiedene Algorithmen im Bereich des Causal Machine Learning entwickelt. Diese vereinen Fortschritte aus dem Machine Learning mit der Theorie der kausalen Inferenz, um unterschiedliche Arten kausaler Effekte zu identifizieren und zu quantifizieren. Mein Kollege Markus hat einige dieser Algorithmen bereits in einem früheren Blogpost vorgestellt.

Da Causal Machine Learning ein recht komplexes Thema ist, werde ich eine Blogserie schreiben, um Schritt für Schritt in diese faszinierende neue Welt der Data Science einzutauchen. Dieser erste Beitrag dient als Einführung und beschäftigt sich mit der Frage, was Causal Machine Learning eigentlich ist und warum es in der Praxis – und für die Zukunft der Data Science – so wichtig ist.

Die Ursprünge des Causal Machine Learning

Wie Markus bereits in seinem früheren Blogpost erklärt hat, dreht sich die Analyse in den Wirtschaftswissenschaften und anderen Sozialwissenschaften in erster Linie um die Schätzung kausaler Effekte – also um die isolierte Wirkung einer bestimmten Einflussgröße (eines Merkmals) auf ein Ergebnis.

Gemäß dem Potential Outcomes Framework, das von Rubin (1947) eingeführt wurde, wird der Behandlungseffekt einer Person wie folgt definiert:

γi=Yi(1)−Yi(0)\gamma_i = Y_i(1) - Y_i(0)γi​=Yi​(1)−Yi​(0)

Dabei bezeichnet Yi(1)Y_i(1)Yi​(1) das potenzielle Ergebnis der Person iii mit Behandlung, während Yi(0)Y_i(0)Yi​(0) das potenzielle Ergebnis ohne Behandlung darstellt.

Tatsächlich liegt das Interesse in den meisten Fällen auf sogenannten Treatment Effects (Behandlungseffekten). Ein Treatment Effect bezeichnet den kausalen Effekt einer Maßnahme oder Intervention auf eine Zielvariable, die aus wissenschaftlicher oder politischer Sicht von Interesse ist.

In der Volkswirtschaftslehre gehört zu den am häufigsten untersuchten Behandlungseffekten der kausale Einfluss eines subventionierten Weiterbildungsprogramms auf das Einkommen.

Im Rahmen des Potential Outcomes Framework, das auf Rubin (1947) zurückgeht, wird der Behandlungseffekt für eine einzelne Person wie folgt definiert:

γi​=Yi​(1)−Yi​(0)

Dabei bezeichnet Yi(1)Y_i(1)Yi​(1) das potenzielle Ergebnis der Person iii mit Behandlung, während Yi(0)Y_i(0)Yi​(0) das potenzielle Ergebnis der Person iii ohne Behandlung darstellt.

Da eine Person jedoch entweder die Behandlung erhält oder nicht, kann immer nur eines der beiden potenziellen Ergebnisse zu einem bestimmten Zeitpunkt beobachtet werden. Der individuelle Behandlungseffekt ist somit nicht direkt beobachtbar. Dieses Problem ist auch als das Fundamentale Problem der kausalen Inferenz (Fundamental Problem of Causal Inference) bekannt.

Unter bestimmten Annahmen können jedoch Durchschnittswerte der individuellen Behandlungseffekte identifiziert werden. In randomisierten Experimenten, bei denen die Behandlung zufällig zugewiesen wird, sind diese Annahmen in der Regel automatisch erfüllt. In solchen Fällen ist die Identifikation beliebiger Aggregationsebenen der individuellen Behandlungseffekte ohne weitere Komplikationen möglich.

In vielen praktischen Situationen sind jedoch randomisierte Experimente nicht durchführbar, sodass Forschende mit Beobachtungsdaten (observational data) arbeiten müssen. Hier sind die genannten Annahmen in der Regel nicht erfüllt. Daher hat sich eine umfangreiche Literatur – insbesondere in der Volkswirtschaftslehre, aber auch in anderen Disziplinen – mit Methoden zur Identifikation kausaler Effekte unter Verletzung dieser Voraussetzungen beschäftigt.

„Vorhersage und kausale Inferenz sind unterschiedliche (wenn auch eng verwandte) Probleme.“
— Athey, 2017, S. 484

Im Gegensatz dazu konzentrierte sich die (überwachte) Machine-Learning-Literatur traditionell auf Vorhersage – also darauf, den Wert der Zielvariable anhand von Merkmalen (Features) vorherzusagen.

Machine-Learning-Modelle sind darauf ausgelegt, komplexe Strukturen in den verfügbaren Daten zu erkennen und so zu generalisieren, dass sie genaue Vorhersagen für neue Daten ermöglichen. Diese Algorithmen können eine enorme Anzahl an Prädiktoren verarbeiten und sie auf nichtlineare und hochinteraktive Weise kombinieren.

Sie haben sich in der Praxis als äußerst erfolgreich erwiesen und finden Anwendung in Bereichen, die von der Medizin bis hin zur Ressourcenzuteilung in Städten reichen.

Die besten Aspekte beider Welten vereint

Obwohl Ökonominnen und andere Sozialwissenschaftlerinnen präzise Schätzungen kausaler Effekte gegenüber reiner Vorhersagekraft bevorzugen, waren sie dennoch fasziniert von den Vorteilen moderner Machine-Learning-Methoden – etwa der hohen Prognosegenauigkeit bei neuen Daten (Out-of-Sample Prediction) oder der Fähigkeit, mit einer großen Anzahl von Merkmalen (Features) umzugehen.

Wie wir jedoch gesehen haben, sind klassische Machine-Learning-Modelle nicht darauf ausgelegt, kausale Effekte zu schätzen. Wenn man Standard-Vorhersagemethoden aus dem Machine Learning direkt zur Schätzung kausaler Effekte einsetzt, führt das in der Regel zu verzerrten (biased) Ergebnissen.

Daher mussten bestehende Machine-Learning-Techniken angepasst werden, um ihre Vorteile für die konsistente und effiziente Schätzung kausaler Effekte nutzbar zu machen – die Geburtsstunde des Causal Machine Learning!

distracted-economist

Zwei Forschungsrichtungen im Causal Machine Learning

Aktuell lässt sich Causal Machine Learning grob in zwei Forschungsrichtungen unterteilen, die sich nach der Art des zu schätzenden kausalen Effekts unterscheiden:

Eine Linie der Forschung konzentriert sich darauf, Machine-Learning-Methoden so zu modifizieren, dass sie unverzerrte und konsistente Schätzungen des durchschnittlichen Behandlungseffekts (Average Treatment Effect, ATE) liefern. Der durchschnittliche Behandlungseffekt ist der Mittelwert aller individuellen Behandlungseffekte in einer gesamten Zielpopulation – und vermutlich der am häufigsten untersuchte Parameter in ökonometrischen Kausalstudien. Modelle aus diesem Bereich zielen auf Fragen wie:

  • Wie reagieren Kund*innen im Durchschnitt auf eine Marketingkampagne?
  • Wie wirkt sich eine Preisänderung im Mittel auf den Umsatz aus?

Die zweite Forschungsrichtung konzentriert sich auf die Identifikation von Heterogenität in Behandlungseffekten. Das heißt: Es sollen Subgruppen von Individuen (basierend auf ihren Merkmalen) identifiziert werden, für die der Behandlungseffekt größer oder kleiner als der Durchschnitt ist. Diese Modelle beantworten Fragen wie:

  • Welche Kund*innen reagieren am stärksten auf eine Marketingkampagne?
  • Wie verändert sich der Effekt einer Preisänderung auf den Umsatz in Abhängigkeit vom Alter der Kund*innen?

Entscheidungsfragen brauchen kausale Antworten

Obwohl die Entwicklung des Causal Machine Learning bisher vor allem von der ökonomischen Forschung vorangetrieben wurde, sollte die Bedeutung für andere Bereiche – insbesondere die Wirtschaft – nicht unterschätzt werden. Unternehmen greifen häufig auf klassische Machine-Learning-Werkzeuge zurück, um Entscheidungsprobleme zu lösen, etwa:

  • Welcher Preis soll gesetzt werden?
  • Welche Kund*innen sollen mit einer Kampagne angesprochen werden?

Allerdings gibt es einen entscheidenden Unterschied zwischen einer Vorhersage und einer Entscheidung. Um wirklich datengetriebene Entscheidungen treffen zu können, ist das Verständnis kausaler Zusammenhänge entscheidend.

Zwei Beispiele aus unserer täglichen Arbeit verdeutlichen dieses Problem:

Beispiel 1: Preiselastizitäten

Im Zentrum jedes Preismanagements eines Unternehmens steht die Frage: Wie reagieren Kund*innen auf Preisänderungen? Um einen optimalen Preis zu setzen, muss das Unternehmen wissen, wie viele Einheiten bei unterschiedlichen (hypothetischen) Preisniveaus verkauft würden. Die wohl praktischste und aussagekräftigste Metrik zur Beantwortung dieser Frage ist die Preiselastizität der Nachfrage.

Auch wenn es auf den ersten Blick sinnvoll erscheint, die Preiselastizität der Nachfrage durch ein klassisches Machine-Learning-Modell zu schätzen – also den Umsatz als Zielvariable zu modellieren und den Preis als Feature – liefert dieser Ansatz nicht automatisch den kausalen Effekt des Preises auf den Umsatz.

„Es bestehen mehrere Lücken zwischen Vorhersage und Entscheidung. Die zugrundeliegenden Annahmen müssen verstanden werden, um datengetriebene Entscheidungen optimal zu gestalten.“
— Athey, 2017, S. 483

Angelehnt an ein Beispiel aus Athey (2017): Angenommen, wir verfügen über historische Daten zu Flugticketpreisen und den entsprechenden Auslastungsraten. Typischerweise sind Preise und Auslastung positiv korreliert, da Fluggesellschaften ihre Preise erhöhen, wenn die Auslastung steigt. Ein klassisches ML-Modell würde in diesem Fall die folgende Frage beantworten:

Wenn der Flugpreis an einem bestimmten Tag hoch ist – wie hoch ist voraussichtlich die Auslastung?

Das Modell würde korrekt vorhersagen, dass die Auslastung vermutlich ebenfalls hoch ist. Es wäre jedoch falsch, daraus zu schließen, dass eine Preiserhöhung zu einer höheren Auslastung führt. Aus Erfahrung wissen wir: Das Gegenteil ist der Fall – würde eine Airline ihre Ticketpreise flächendeckend um 10 % erhöhen, würden voraussichtlich weniger Tickets verkauft.

Beispiel 2: Kundenabwanderung (Churn)

Ein weiteres typisches Problem, das Unternehmen mit Machine Learning zu lösen versuchen, ist die Vorhersage von Kundenabwanderung (Customer Churn), also der Abbruch einer Geschäftsbeziehung durch Kundinnen. Ziel ist es, jene Kundinnen mit dem höchsten Risiko zu identifizieren, um gezielte Maßnahmen zur Kundenbindung ergreifen zu können.

Klassische Machine-Learning-Algorithmen sind hervorragend darin, Churn-Risiken vorherzusagen. Leider helfen diese Vorhersagen nicht ausreichend bei der Frage, welche Kund*innen am sinnvollsten mit Maßnahmen angesprochen werden sollten. Denn diese Frage ist kausaler Natur:

Bei welchen Kund*innen haben Maßnahmen zur Kundenbindung den größten kausalen Effekt auf deren Verhalten?

Studien haben gezeigt, dass der Überlapp zwischen jenen Kund*innen mit dem höchsten Churn-Risiko und jenen, die am stärksten auf Maßnahmen reagieren, oft weit unter 100 % liegt. Behandelt man das Problem rein als Vorhersageproblem und verwendet klassische ML-Modelle, erzielt man suboptimale Ergebnisse und geringere wirtschaftliche Erträge.

Der Wunsch jedes Data Scientists

Abgesehen von den praktischen Anwendungsfällen gibt es einen grundlegenderen Grund, warum Causal Machine Learning für alle Data Scientists interessant sein sollte: Modellgeneraliserbarkeit.

Ein Machine-Learning-Modell, das kausale Zusammenhänge erfassen kann, lässt sich besser auf neue Situationen übertragen – was bis heute eine der größten Herausforderungen im Machine Learning ist.

rooster

Zur Veranschaulichung möchte ich ein Beispiel aus „The Book of Why“ von Pearl und Mackenzie (2018) verwenden: das Beispiel vom Hahn und der Sonne.

Ein Machine-Learning-Algorithmus, dem Daten über einen Hahn und den Sonnenaufgang gezeigt werden, würde eine Assoziation zwischen dem Krähen des Hahns und dem Aufgehen der Sonne herstellen. Er könnte sogar ziemlich genau vorhersagen, wann die Sonne aufgeht: Wenn der Hahn gerade gekräht hat, geht kurz danach die Sonne auf.

Ein solches Modell, das nur Korrelationen erfassen kann, würde jedoch nicht generalisieren, wenn kein Hahn vorhanden ist. In einem solchen Fall würde ein klassisches Machine-Learning-Modell niemals vorhersagen, dass die Sonne aufgeht, da es keinen entsprechenden Datenpunkt kennt – also einen Sonnenaufgang ohne Hahn.

Wenn das Modell jedoch die wahre kausale Beziehung erlernt hätte – nämlich, dass das bevorstehende Aufgehen der Sonne das Krähen des Hahns verursacht –, dann könnte es problemlos vorhersagen, dass die Sonne auch ohne Hahn aufgehen wird.

Keine echte Künstliche Intelligenz ohne kausales Denken

Pearl und Mackenzie (2018) gehen noch einen Schritt weiter: Sie argumentieren, dass wir niemals eine echte, menschenähnliche Künstliche Intelligenz erreichen können, ohne Maschinen das kausale Denken beizubringen. Ursache und Wirkung sind laut ihnen die zentralen Mechanismen, mit denen wir Menschen die komplexe Welt um uns herum verstehen und verarbeiten.

Die bloße Fähigkeit, Korrelationen vorherzusagen, macht Maschinen noch nicht intelligent – sie erlaubt ihnen lediglich, eine Realität zu modellieren, basierend auf den Daten, die ihnen zur Verfügung stehen.

„Die Algorithmisierung von kontrafaktischen Überlegungen lädt denkende Maschinen dazu ein, von der Fähigkeit zu profitieren, über vergangene Handlungen zu reflektieren und an dieser – bisher einzigartig menschlichen – Art, über die Welt nachzudenken, teilzuhaben.“
— Pearl & Mackenzie, 2018, S. 10

Darüber hinaus müssen Machine-Learning-Modelle in der Lage sein, kausale Effekte zu erkennen, um kontrafaktische Fragen stellen zu können – also Fragen danach, wie sich eine Beziehung unter einer bestimmten Intervention verändern würde.

Da kontrafaktische Überlegungen als Grundpfeiler moralischen Handelns und wissenschaftlichen Denkens gelten, werden Maschinen nur dann effektiver mit uns Menschen kommunizieren und den Status moralischer Wesen mit freiem Willen erreichen können, wenn sie kausales – und damit auch kontrafaktisches – Denken erlernen.

Ausblick

Auch wenn dieser letzte Abschnitt zum Schluss hin etwas philosophisch geworden ist, hoffe ich, dass dir dieser Blogpost einen guten Einblick geben konnte, was Causal Machine Learning ist – und warum es nicht nur in der Praxis, sondern auch für die Zukunft der Data Science insgesamt essenziell ist.

In meinen kommenden Blogbeiträgen werde ich verschiedene Aspekte dieses Themas detaillierter beleuchten. Zum Beispiel werde ich genauer auf die Probleme eingehen, die beim Einsatz klassischer Machine-Learning-Algorithmen zur Schätzung kausaler Effekte entstehen, oder verschiedene Causal-Machine-Learning-Algorithmen in einer Simulationsstudie vergleichen.

Referenzen

  • Athey, S. (2017). Beyond prediction: using big data for policy problems. Science 335, 483-485.
  • Pearl, J., & Mackenzie, D. (2018). The book of why. New York, NY: Basic Books.
  • Rubin, D. B. (1974). Estimating causal effects of treatments in randomised and non-randomised studies. Journal of Educational Psychology, 66(5), 688-701.
Linkedin Logo
Marcel Plaschke
Head of Strategy, Sales & Marketing
Beratung vereinbaren
Zugehörige Leistungen
No items found.

Weitere Blogartikel

  • Artificial Intelligence
AI Trends Report 2025: Die 16 Trends im Überblick
Tarik Ashry
05. Februar 2025
Mehr erfahren
  • Artificial Intelligence
  • Data Science
  • Human-centered AI
Explainable AI in der Praxis: Mit der richtigen Methode die Black Box öffnen
Jonas Wacker
15. November 2024
Mehr erfahren
  • Artificial Intelligence
  • Data Science
  • GenAI
Wie ein CustomGPT Effizienz und Kreativität bei hagebau fördert
Tarik Ashry
06. November 2024
Mehr erfahren
  • Artificial Intelligence
  • Data Culture
  • Data Science
  • Deep Learning
  • GenAI
  • Machine Learning
AI Trends Report 2024: statworx COO Fabian Müller zieht eine Zwischenbilanz
Tarik Ashry
05. September 2024
Mehr erfahren
  • Artificial Intelligence
  • Human-centered AI
  • Strategy
Der AI-Act ist da – diese Risikoklassen sollte man kennen
Fabian Müller
05. August 2024
Mehr erfahren
  • Artificial Intelligence
  • GenAI
  • statworx
Zurück in die Zukunft: Die Geschichte von Generativer KI (Episode 4)
Tarik Ashry
31. Juli 2024
Mehr erfahren
  • Artificial Intelligence
  • GenAI
  • statworx
Zurück in die Zukunft: Die Geschichte von Generativer KI (Episode 3)
Tarik Ashry
24. Juli 2024
Mehr erfahren
  • Artificial Intelligence
  • GenAI
  • statworx
Zurück in die Zukunft: Die Geschichte von Generativer KI (Episode 2)
Tarik Ashry
17. Juli 2024
Mehr erfahren
  • Artificial Intelligence
  • GenAI
  • statworx
Zurück in die Zukunft: Die Geschichte von Generativer KI (Episode 1)
Tarik Ashry
10. Juli 2024
Mehr erfahren
  • Artificial Intelligence
  • GenAI
  • statworx
Generative KI als Denkmaschine? Ein medientheoretischer Blick
Tarik Ashry
13. Juni 2024
Mehr erfahren
  • Artificial Intelligence
  • GenAI
  • statworx
Maßgeschneiderte KI-Chatbots: Hohe Leistung und schnelle Integration vereint
Tarik Ashry
10. April 2024
Mehr erfahren
  • Artificial Intelligence
  • Data Culture
  • Human-centered AI
Wie Führungskräfte die Datenkultur im Unternehmen stärken können
Tarik Ashry
21. Februar 2024
Mehr erfahren
  • Artificial Intelligence
  • Data Culture
  • Human-centered AI
KI in der Arbeitswelt: Wie wir Skepsis in Zuversicht verwandeln
Tarik Ashry
08. Februar 2024
Mehr erfahren
  • Artificial Intelligence
  • Data Science
Wie wir für Microsoft einen Chatbot mit echtem Wissen entwickelt haben
Team statworx
27. September 2023
Mehr erfahren
  • Data Science
  • Data Visualization
  • Frontend Solution
Warum Frontend-Entwicklung in Data Science-Anwendungen nützlich ist
Jakob Gepp
30. August 2023
Mehr erfahren
  • Artificial Intelligence
  • Human-centered AI
  • statworx
the byte - Wie wir ein KI-gesteuertes Pop-up Restaurant aufgebaut haben
Sebastian Heinz
14. Juni 2023
Mehr erfahren
  • Artificial Intelligence
  • Recap
  • statworx
Big Data & AI World 2023 Recap
Team statworx
24. Mai 2023
Mehr erfahren
  • Data Science
  • Human-centered AI
  • Statistics & Methods
Die Black-Box entschlüsseln – 3 Explainable AI Methoden zur Vorbereitung auf den AI-Act
Team statworx
17. Mai 2023
Mehr erfahren
  • Artificial Intelligence
  • Human-centered AI
  • Strategy
Wie der AI-Act die KI-Branche verändern wird: Alles, was man jetzt darüber wissen muss
Team statworx
11. Mai 2023
Mehr erfahren
  • Artificial Intelligence
  • Human-centered AI
  • Machine Learning
Genderdarstellung in der KI – Teil 2: Automatisierte Erzeugung genderneutraler Versionen von Gesichtsbildern
Team statworx
03. Mai 2023
Mehr erfahren
  • Artificial Intelligence
  • Data Science
  • Statistics & Methods
Ein erster Einblick in unser Forecasting Recommender Tool
Team statworx
26. April 2023
Mehr erfahren
  • Artificial Intelligence
  • Data Science
Vom Können, Tun und Wollen – Warum Datenkultur und Death Metal einiges miteinander gemeinsam haben
David Schlepps
19. April 2023
Mehr erfahren
  • Artificial Intelligence
  • Human-centered AI
  • Machine Learning
GPT-4 – Eine Einordnung der wichtigsten Neuerungen
Mareike Flögel
17. März 2023
Mehr erfahren
  • Artificial Intelligence
  • Data Science
  • Strategy
Das Geheimnis der Datenkultur entschlüsseln: Diese Faktoren beeinflussen Kultur und Erfolg von Unternehmen
Team statworx
16. März 2023
Mehr erfahren
  • Artificial Intelligence
  • Deep Learning
  • Machine Learning
Wie man KI-generierte Avatare mit Hilfe von Stable Diffusion und Textual Inversion erstellt
Team statworx
08. März 2023
Mehr erfahren
  • Artificial Intelligence
  • Human-centered AI
  • Strategy
Knowledge Management mit NLP: So einfach verarbeitet man E-Mails mit KI
Team statworx
02. März 2023
Mehr erfahren
  • Artificial Intelligence
  • Deep Learning
  • Machine Learning
3 Anwendungsfälle, wie ChatGPT die Kommunikation in Unternehmen revolutionieren wird
Ingo Marquart
16. Februar 2023
Mehr erfahren
  • Recap
  • statworx
Ho ho ho – weihnachtlicher Küchenabriss
Julius Heinz
22. Dezember 2022
Mehr erfahren
  • Artificial Intelligence
  • Deep Learning
  • Machine Learning
Real-time Computer Vision: Gesichter erkennen mit einem Roboter
Sarah Sester
30. November 2022
Mehr erfahren
  • Data Engineering
  • Tutorial
Data Engineering – From Zero to Hero
Thomas Alcock
23. November 2022
Mehr erfahren
  • Recap
  • statworx
statworx @ UXDX Conf 2022
Markus Berroth
18. November 2022
Mehr erfahren
  • Artificial Intelligence
  • Machine Learning
  • Tutorial
Paradigmenwechsel in NLP: 5 Ansätze, um bessere Prompts zu schreiben
Team statworx
26. Oktober 2022
Mehr erfahren
  • Recap
  • statworx
statworx @ vuejs.de Conf 2022
Jakob Gepp
14. Oktober 2022
Mehr erfahren
  • Data Engineering
  • Data Science
Überwachung und Protokollierung von Anwendungen und Infrastruktur: Metriken und (Ereignis-)Protokolle
Team statworx
29. September 2022
Mehr erfahren
  • Coding
  • Data Science
  • Machine Learning
Zero-Shot Textklassifikation
Fabian Müller
29. September 2022
Mehr erfahren
  • Cloud Technology
  • Data Engineering
  • Data Science
Wie du dein Data Science Projekt fit für die Cloud machst
Alexander Broska
14. September 2022
Mehr erfahren
  • Artificial Intelligence
  • Human-centered AI
  • Machine Learning
Geschlechter­darstellung in der KI – Teil 1: Verwendung von StyleGAN zur Erforschung von Geschlechter­vielfalt bei der Bild­bearbeitung
Isabel Hermes
18. August 2022
Mehr erfahren
  • Artificial Intelligence
  • Human-centered AI
statworx AI Principles: Warum wir eigene KI-Prinzipien entwickeln
Team statworx
04. August 2022
Mehr erfahren
  • Data Engineering
  • Data Science
  • Python
Wie Du Deinen Code und Deine Abhängigkeiten in Python scannst
Thomas Alcock
21. Juli 2022
Mehr erfahren
  • Data Engineering
  • Data Science
  • Machine Learning
Data-Centric AI: Von Model-First zu Data-First KI-Prozessen
Team statworx
13. Juli 2022
Mehr erfahren
  • Artificial Intelligence
  • Deep Learning
  • Human-centered AI
  • Machine Learning
DALL-E 2: Warum Diskriminierung in der KI-Entwicklung nicht ignoriert werden kann
Team statworx
28. Juni 2022
Mehr erfahren
  • R
Das helfRlein Package – Eine Sammlung nützlicher Funktionen
Team statworx
23. Juni 2022
Mehr erfahren
  • Recap
  • statworx
Unfold 2022 in Bern – by Cleverclip
Team statworx
11. Mai 2022
Mehr erfahren
  • Artificial Intelligence
  • Data Science
  • Human-centered AI
  • Machine Learning
Vorurteile in KI abbauen
Team statworx
08. März 2022
Mehr erfahren
  • Artificial Intelligence
  • Cloud Technology
  • Data Science
  • Sustainable AI
Wie du als Data Scientist deinen KI CO₂ Fußabdruck verringerst
Team statworx
02. Februar 2022
Mehr erfahren
  • Recap
  • statworx
2022 und die Reise zu statworx next
Sebastian Heinz
06. Januar 2022
Mehr erfahren
  • Recap
  • statworx
5 Highlights vom Digital Festival Zürich 2021
Team statworx
25. November 2021
Mehr erfahren
  • Data Science
  • Human-centered AI
  • Machine Learning
  • Strategy
Warum Data Science und KI-Initiativen scheitern – eine Reflektion zu nicht-technischen Faktoren
Team statworx
22. September 2021
Mehr erfahren
  • Artificial Intelligence
  • Data Science
  • Human-centered AI
  • Machine Learning
  • statworx
Kolumne: Mensch und Maschine Seite an Seite
Sebastian Heinz
03. September 2021
Mehr erfahren
  • Coding
  • Data Science
  • Python
Wie man mit Call Graph automatisch Projektgrafiken erstellt
Team statworx
25. August 2021
Mehr erfahren
  • Coding
  • Python
  • Tutorial
statworx Cheatsheets – Python Basics Cheatsheet für Data Science
Team statworx
13. August 2021
Mehr erfahren
  • Data Science
  • statworx
  • Strategy
STATWORX meets DHBW – Data Science Real-World Use Cases
Team statworx
04. August 2021
Mehr erfahren
  • Data Engineering
  • Data Science
  • Machine Learning
Machine Learning Modelle bereitstellen und skalieren mit Kubernetes
Team statworx
29. Juli 2021
Mehr erfahren
  • Cloud Technology
  • Data Engineering
  • Machine Learning

3 Szenarien zum Deployment von Machine Learning Workflows mittels MLflow
Team statworx
30. Juni 2021
Mehr erfahren
  • Artificial Intelligence
  • Deep Learning
  • Machine Learning

Car Model Classification III: Erklärbarkeit von Deep Learning Modellen mit Grad-CAM
Team statworx
19. Mai 2021
Mehr erfahren
  • Artificial Intelligence
  • Coding
  • Deep Learning
Car Model Classification II: Deployment von TensorFlow-Modellen in Docker mit TensorFlow Serving
Team statworx
12. Mai 2021
Mehr erfahren
  • Coding
  • Deep Learning
Car Model Classification I: Transfer Learning mit ResNet
Team statworx
05. Mai 2021
Mehr erfahren
  • Artificial Intelligence
  • Deep Learning
  • Machine Learning
Car Model Classification IV: Integration von Deep Learning Modellen mit Dash
Dominique Lade
05. Mai 2021
Mehr erfahren
  • AI Act
Potenzial noch nicht ausgeschöpft – Ein Kommentar zur vorgeschlagenen KI-Regulierung der EU
Team statworx
Mehr erfahren
  • Artificial Intelligence
  • Deep Learning
  • statworx
Creaition – Revolutionierung des Designprozesses mit Machine Learning
Team statworx
31. März 2021
Mehr erfahren
  • Artificial Intelligence
  • Data Science
  • Machine Learning
5 Typen von Machine Learning Algorithmen (Mit Anwendungsfällen)
Team statworx
24. März 2021
Mehr erfahren
  • Recaps
  • statworx
2020 – Ein Rückblick für mich und GPT-3
Sebastian Heinz
23. Dezember 2020
Mehr erfahren
  • Artificial Intelligence
  • Deep Learning
  • Machine Learning
5 praxisnahe Beispiele für NLP Use Cases
Team statworx
12. November 2020
Mehr erfahren
  • Data Science
  • Deep Learning
Die 5 wichtigsten Use Cases für Computer Vision
Team statworx
05. November 2020
Mehr erfahren
  • Data Science
  • Deep Learning
Neue Trends im Natural Language Processing – Wie NLP massentauglich wird
Dominique Lade
29. Oktober 2020
Mehr erfahren
  • Data Engineering
5 Technologien, die jeder Data Engineer kennen sollte
Team statworx
22. Oktober 2020
Mehr erfahren
  • Artificial Intelligence
  • Data Science
  • Machine Learning
Generative Adversarial Networks: Wie mit Neuronalen Netzen Daten generiert werden können
Team statworx
15. Oktober 2020
Mehr erfahren
  • Coding
  • Data Science
  • Deep Learning
Finetuning von Tesseract-OCR für deutsche Rechnungen
Team statworx
08. Oktober 2020
Mehr erfahren
  • Artificial Intelligence
  • Machine Learning
Whitepaper: Ein Reifegradmodell für Künstliche Intelligenz
Team statworx
06. Oktober 2020
Mehr erfahren
  • Data Engineering
  • Data Science
  • Machine Learning
Machine Learning Modelle mit Hilfe von Docker Containern bereitstellen
Thomas Alcock
01. Oktober 2020
Mehr erfahren
  • Recap
  • statworx
STATWORX 2.0 – Das neue Headquarter in Frankfurt ist eröffnet
Julius Heinz
24. September 2020
Mehr erfahren
  • Machine Learning
  • Python
  • Tutorial
Wie man eine Machine Learning API mit Python und Flask erstellt
Team statworx
29. Juli 2020
Mehr erfahren
  • Data Science
  • Statistics & Methods
Modellregularisierung – The Bayesian Way
Thomas Alcock
15. Juli 2020
Mehr erfahren
  • Recap
  • statworx
Auf zu neuen Abenteuern: Soft Opening des STATWORX Büros
Team statworx
14. Juli 2020
Mehr erfahren
  • Data Engineering
  • R
  • Tutorial
Wie Du ShinyApps in Docker-Images einbauen kannst
Team statworx
15. Mai 2020
Mehr erfahren
  • Coding
  • Python
Making Of: Eine kostenlose API für COVID-19-Daten
Sebastian Heinz
01. April 2020
Mehr erfahren
  • Frontend
  • Python
  • Tutorial
Wie Du ein Dashboard In Python baust – Plotly Dash Step-by-Step Tutorial
Alexander Blaufuss
26. März 2020
Mehr erfahren
  • Coding
  • R
Warum heißen sie so?! – Ursprung und Bedeutung von R-Paketnamen
Team statworx
19. März 2020
Mehr erfahren
  • Data Visualization
  • R
Gemeinschaftsdetektion mit Louvain und Infomap
Team statworx
04. März 2020
Mehr erfahren
  • Coding
  • Data Engineering
  • Data Science
Testen von REST-APIs mit Newman
Team statworx
26. Februar 2020
Mehr erfahren
  • Coding
  • Frontend
  • R
Dynamische UI-Elemente in Shiny - Teil 2
Team statworx
19. Februar 2020
Mehr erfahren
  • Coding
  • Data Visualization
  • R
Animierte Plots mit ggplot und gganimate
Team statworx
14. Februar 2020
Mehr erfahren
  • Machine Learning
Machine Learning Goes Causal II: Der kausale Bruder des Random Forests
Team statworx
05. Februar 2020
Mehr erfahren
  • Data Engineering
  • R
  • Tutorial
Wie man REST-APIs mit R Plumber erstellt
Stephan Emmer
23. Januar 2020
Mehr erfahren
  • Recaps
  • statworx
statworx 2019 – Ein Jahresrückblick
Sebastian Heinz
20. Dezember 2019
Mehr erfahren
  • Artificial Intelligence
  • Deep Learning
Deep Learning – Überblick und Einstieg
Team statworx
04. Dezember 2019
Mehr erfahren
  • Coding
  • Machine Learning
  • R
Abstimmung von Random Forest auf Zeitreihendaten
Team statworx
21. November 2019
Mehr erfahren
  • Data Science
  • R
Kombination von Preiselastizitäten und Verkaufsprognosen zur Verkaufssteigerung
Team statworx
06. November 2019
Mehr erfahren
  • Data Engineering
  • Python
Von überall aus auf deinen Spark-Cluster zugreifen – mit Apache Livy
Team statworx
30. Oktober 2019
Mehr erfahren
  • Recap
  • statworx
STATWORX auf Tour: Wein, Burgen & Wandern!
Team statworx
18. Oktober 2019
Mehr erfahren
  • Data Science
  • R
  • Statistics & Methods
Wie man eine Kreuzvalidierung zur Evaluation der Modellperformance von Grund auf selbst erstellt
Team statworx
02. Oktober 2019
Mehr erfahren
  • Data Science
  • Machine Learning
  • R
Zeitreihenvorhersage mit Random Forest
Team statworx
25. September 2019
Mehr erfahren
  • Coding
  • Frontend
  • R
Dynamische UI Elemente in Shiny – Teil 1
Team statworx
11. September 2019
Mehr erfahren
  • Machine Learning
  • R
  • Statistics & Methods
Was dem MAPE fälschlicherweise vorgeworfen wird, seine WAHREN Schwächen und BESSERE Alternativen!
Team statworx
16. August 2019
Mehr erfahren
  • Coding
  • Python
Web Scraping 101 in Python mit Requests & BeautifulSoup
Team statworx
31. Juli 2019
Mehr erfahren
  • Coding
  • Frontend
  • R
Einstieg in Flexdashboards in R
Thomas Alcock
19. Juli 2019
Mehr erfahren
  • Recap
  • statworx
statworx Sommer-Barbecue 2019
Team statworx
21. Juni 2019
Mehr erfahren
  • Data Visualization
  • R
Interaktive Netzwerkvisualisierung mit R
Team statworx
12. Juni 2019
Mehr erfahren
  • Deep Learning
  • Python
  • Tutorial
Verwendung von Reinforcement Learning zum Spielen von Super Mario Bros auf NES mit TensorFlow
Sebastian Heinz
29. Mai 2019
Mehr erfahren
  • Coding
  • Data Engineering
Automatisierte Erstellung von Docker Containern
Stephan Emmer
10. Mai 2019
Mehr erfahren
This is some text inside of a div block.
This is some text inside of a div block.