ZurĂŒck zu allen BlogbeitrĂ€gen

Zero-Shot Textklassifikation

  • Coding
  • Data Science
  • Machine Learning
29. September 2022
·

Fabian MĂŒller
COO

Die Textklassifikation ist eine der hĂ€ufigsten Anwendungen der natĂŒrlichen Sprachverarbeitung (NLP). Sie besteht darin, einem Textausschnitt eine Reihe vordefinierter Kategorien zuzuweisen. Je nach Art des Problems kann der Textausschnitt ein Satz, ein Absatz oder sogar ein ganzes Dokument sein. Es gibt viele potenzielle Anwendungen der Textklassifikation in der realen Welt, aber zu den hĂ€ufigsten gehören Sentiment-Analyse, Themenmodellierung und Absicht, Spam- und Hassrede-Erkennung.

Der Standardansatz zur Textklassifikation besteht darin, einen Klassifikator in einem ĂŒberwachten Regime zu trainieren. Dazu benötigt man Paare aus Text und zugehörigen Kategorien (auch Labels genannt) aus dem interessierenden Bereich als Trainingsdaten. Dann kann ein beliebiger Klassifikator (z.B. ein neuronales Netzwerk) eine Zuordnungsfunktion vom Text zur wahrscheinlichsten Kategorie lernen. WĂ€hrend dieser Ansatz in vielen Situationen gut funktionieren kann, hĂ€ngt seine DurchfĂŒhrbarkeit stark von der VerfĂŒgbarkeit dieser handbeschrifteten Trainingsdatenpaare ab.

Auch wenn vortrainierte Sprachmodelle wie BERT die benötigte Datenmenge reduzieren können, machen sie diese nicht vollstĂ€ndig ĂŒberflĂŒssig. Daher bleibt die DatenverfĂŒgbarkeit fĂŒr Anwendungen in der realen Welt die grĂ¶ĂŸte HĂŒrde.

Zero-Shot-Lernen

Es gibt zwar verschiedene Definitionen des Zero-Shot-Lernens1, aber im Allgemeinen kann es als ein Regime definiert werden, in dem ein Modell eine Aufgabe löst, auf die es zuvor nicht explizit trainiert wurde.

Es ist wichtig zu verstehen, dass eine „Aufgabe“ sowohl im weiteren als auch im engeren Sinne definiert werden kann: Zum Beispiel zeigten die Autoren von GPT-2, dass ein auf Sprachgenerierung trainiertes Modell auf völlig neue nachgelagerte Aufgaben wie maschinelle Übersetzung2 angewendet werden kann. Gleichzeitig wĂ€re eine engere Definition der Aufgabe, zuvor ungesehene Kategorien in Bildern zu erkennen, wie im OpenAI CLIP-Papier3 gezeigt.

Aber was all diese AnsĂ€tze gemeinsam haben, ist die Idee der Extrapolation gelernter Konzepte ĂŒber das Trainingsregime hinaus. Ein mĂ€chtiges Konzept, weil es die Lösbarkeit einer Aufgabe von der VerfĂŒgbarkeit von (beschrifteten) Trainingsdaten entkoppelt.

Zero-Shot-Lernen fĂŒr Textklassifikation

Die Lösung von Textklassifikationsaufgaben mit Zero-Shot-Lernen kann als gutes Beispiel dafĂŒr dienen, wie man die Extrapolation gelernter Konzepte ĂŒber das Trainingsregime hinaus anwenden kann. Eine Möglichkeit, dies zu tun, ist die Verwendung von natĂŒrlicher Sprachinferenz (NLI) wie von Yin et al. (2019)4 vorgeschlagen. Es gibt auch andere AnsĂ€tze, wie die Berechnung von AbstĂ€nden zwischen Text-Einbettungen oder die Formulierung des Problems als LĂŒckentext.

Bei NLI besteht die Aufgabe darin zu bestimmen, ob eine Hypothese in Anbetracht einer PrÀmisse5 wahr (entailment), falsch (contradiction) oder unbestimmt (neutral) ist. Ein typischer NLI-Datensatz besteht aus Satzpaaren mit zugehörigen Labels in der folgenden Form:

Beispiele von http://nlpprogress.com/english/natural_language_inference.html

Yin et al. (2019) schlugen vor, große Sprachmodelle wie BERT, die auf NLI-DatensĂ€tzen trainiert sind, zu nutzen und ihre SprachverstĂ€ndnisfĂ€higkeiten fĂŒr die Zero-Shot-Textklassifikation auszunutzen. Dies kann geschehen, indem man den interessierenden Text als PrĂ€misse nimmt und fĂŒr jede potenzielle Kategorie eine Hypothese formuliert, indem man eine sogenannte Hypothesen-Vorlage verwendet. Dann lĂ€sst man das NLI-Modell vorhersagen, ob die PrĂ€misse die Hypothese beinhaltet. Schließlich kann die vorhergesagte Wahrscheinlichkeit der Einbeziehung als Wahrscheinlichkeit des Labels interpretiert werden.

Zero-Shot-Textklassifikation mit Hugging Face đŸ€—

Lass uns die oben formulierte Idee genauer untersuchen, indem wir die hervorragende Hugging Face-Implementierung fĂŒr Zero-Shot-Textklassifikation verwenden.

Wir sind daran interessiert, den untenstehenden Satz in vordefinierte Themen zu klassifizieren:

topics = ['Web', 'Panorama', 'International', 'Wirtschaft', 'Sport', 'Inland', 'Etat', 'Wissenschaft', 'Kultur']
test_txt = 'Eintracht Frankfurt gewinnt die Europa League nach 6:5-Erfolg im Elfmeterschießen gegen die Glasgow Rangers'

‍

Dank der đŸ€— Pipeline-Abstraktion mĂŒssen wir die Vorhersageaufgabe nicht selbst definieren. Wir mĂŒssen lediglich eine Pipeline instanziieren und die Aufgabe als zero-shot-text-classification definieren. Die Pipeline kĂŒmmert sich um die Formulierung der PrĂ€misse und Hypothese sowie um den Umgang mit den Logits und Wahrscheinlichkeiten aus dem Modell.

Wie oben geschrieben, benötigen wir ein Sprachmodell, das auf einer NLI-Aufgabe vortrainiert wurde. Das Standardmodell fĂŒr Zero-Shot-Textklassifikation in đŸ€— ist bart-large-mnli. BART ist ein Transformer-Encoder-Decoder fĂŒr Sequenz-zu-Sequenz-Modellierung mit einem bidirektionalen (BERT-Ă€hnlichen) Encoder und einem autoregressiven (GPT-Ă€hnlichen) Decoder6. Das mnli-Suffix bedeutet, dass BART anschließend auf dem MultiNLI-Datensatz7 weiter trainiert wurde.

Da wir jedoch deutsche SĂ€tze verwenden und BART nur Englisch unterstĂŒtzt, mĂŒssen wir das Standardmodell durch ein benutzerdefiniertes Modell ersetzen. Dank des đŸ€— Modell-Hubs ist es ziemlich einfach, einen geeigneten Kandidaten zu finden. In unserem Fall ist mDeBERTa-v3-base-xnli-multilingual-nli-2mil7 ein solcher Kandidat. Lass uns den Namen kurz entschlĂŒsseln fĂŒr ein besseres VerstĂ€ndnis: Es ist eine mehrsprachige Version von DeBERTa-v3-base (das selbst eine verbesserte Version von BERT/RoBERTa8 ist), die anschließend auf zwei cross-lingualen NLI-DatensĂ€tzen (XNLI9 und multilingual-NLI-26lang10) weiter trainiert wurde.

Mit der richtigen Aufgabe und dem richtigen Modell können wir nun die Pipeline instanziieren:

from transformers import pipeline
model = 'MoritzLaurer/mDeBERTa-v3-base-xnli-multilingual-nli-2mil7'
pipe = pipeline(task='zero-shot-classification', model=model, tokenizer=model)

‍

Als nĂ€chstes rufen wir die Pipeline auf, um die wahrscheinlichste Kategorie unseres Textes basierend auf den Kandidaten vorherzusagen. Aber als letzten Schritt mĂŒssen wir auch die Standard-Hypothesen-Vorlage ersetzen. Dies ist notwendig, da die Standardvorlage wieder auf Englisch ist. Daher definieren wir die Vorlage als 'Das Thema ist {}'. Beachte, dass {} ein Platzhalter fĂŒr die zuvor definierten Themenkandidaten ist. Du kannst jede Vorlage definieren, die dir gefĂ€llt, solange sie einen Platzhalter fĂŒr die Kandidaten enthĂ€lt:

template_de = 'Das Thema ist {}'
prediction = pipe(test_txt, topics, hypothesis_template=template_de)


Schließlich können wir die Vorhersage aus der Pipeline bewerten. Der untenstehende Code gibt die drei wahrscheinlichsten Themen zusammen mit ihren vorhergesagten Wahrscheinlichkeiten aus:

print(f'Zero-shot prediction for: \n {prediction["sequence"]}')
top_3 = zip(prediction['labels'][0:3], prediction['scores'][0:3])
for label, score in top_3:
    print(f'{label} - {score:.2%}')
Zero-shot prediction for: 
 Eintracht Frankfurt gewinnt die Europa League nach 6:5-Erfolg im Elfmeterschießen gegen die Glasgow Rangers
Sport - 77.41%
International - 15.69%
Inland - 5.29%


Wie man sehen kann, liefert das Zero-Shot-Modell ein vernĂŒnftiges Ergebnis, wobei „Sport“ das wahrscheinlichste Thema ist, gefolgt von „International“ und „Inland“.

Unten sind einige weitere Beispiele aus anderen Kategorien. Wie zuvor sind die Ergebnisse insgesamt recht vernĂŒnftig. Beachte, wie das Modell fĂŒr den zweiten Text eine unerwartet niedrige Wahrscheinlichkeit fĂŒr „Kultur“ vorhersagt.

further_examples = ['Verbraucher halten sich wegen steigender Zinsen und Inflation beim Immobilienkauf zurĂŒck',
                    '„Die bitteren TrĂ€nen der Petra von Kant“ von 1972 geschlechtsumgewandelt und neu verfilmt',
                    'Eine 541 Millionen Jahre alte fossile Alge weist erstaunliche Ähnlichkeit zu noch heute existierenden Vertretern auf']

for txt in further_examples:
    prediction = pipe(txt, topics, hypothesis_template=template_de)
    print(f'Zero-shot prediction for: \n {prediction["sequence"]}')
    top_3 = zip(prediction['labels'][0:3], prediction['scores'][0:3])
    for label, score in top_3:
        print(f'{label} - {score:.2%}')
Zero-shot prediction for: 
  Verbraucher halten sich wegen steigender Zinsen und Inflation beim Immobilienkauf zurĂŒck 
Wirtschaft - 96.11% 
Inland - 1.69% 
Panorama - 0.70% 

Zero-shot prediction for: 
  „Die bitteren TrĂ€nen der Petra von Kant“ von 1972 geschlechtsumgewandelt und neu verfilmt 
International - 50.95% 
Inland - 16.40% 
Kultur - 7.76% 

Zero-shot prediction for: 
  Eine 541 Millionen Jahre alte fossile Alge weist erstaunliche Ähnlichkeit zu noch heute existierenden Vertretern auf 
Wissenschaft - 67.52% 
Web - 8.14% 
Inland - 6.91%

‍
Der gesamte Code kann auf GitHub gefunden werden. Neben den oben genannten Beispielen findest du dort auch Anwendungen der Zero-Shot-Textklassifikation auf zwei beschrifteten DatensĂ€tzen, einschließlich einer Bewertung der Genauigkeit. DarĂŒber hinaus habe ich einige Prompt-Tuning durchgefĂŒhrt, indem ich mit der Hypothesen-Vorlage experimentiert habe.

Abschließende Gedanken

Zero-Shot-Textklassifikation bietet einen geeigneten Ansatz, wenn entweder Trainingsdaten begrenzt (oder sogar nicht vorhanden) sind oder als einfach zu implementierende Benchmark fĂŒr anspruchsvollere Methoden. WĂ€hrend explizite AnsĂ€tze, wie das Feinabstimmen großer vortrainierter Modelle, sicherlich immer noch implizite AnsĂ€tze wie das Zero-Shot-Lernen ĂŒbertreffen, macht ihre universelle Anwendbarkeit sie sehr attraktiv.

DarĂŒber hinaus sollten wir erwarten, dass Zero-Shot-Lernen im Allgemeinen in den nĂ€chsten Jahren wichtiger wird. Dies liegt daran, dass sich die Art und Weise, wie wir Modelle zur Lösung von Aufgaben verwenden werden, mit der zunehmenden Bedeutung großer vortrainierter Modelle weiterentwickeln wird. Daher plĂ€diere ich dafĂŒr, dass Zero-Shot-Techniken bereits heute Teil des Werkzeugsatzes eines modernen Datenwissenschaftlers sein sollten

Quellen:

1 https://joeddav.github.io/blog/2020/05/29/ZSL.html
2 https://d4mucfpksywv.cloudfront.net/better-language-models/language_models_are_unsupervised_multitask_learners.pdf
3 https://arxiv.org/pdf/2103.00020.pdf
4 https://arxiv.org/pdf/1909.00161.pdf
5
http://nlpprogress.com/english/natural_language_inference.html
6
https://arxiv.org/pdf/1910.13461.pdf
7
https://huggingface.co/datasets/multi_nli
8 https://arxiv.org/pdf/2006.03654.pdf
9
https://huggingface.co/datasets/xnli
10 https://huggingface.co/datasets/MoritzLaurer/multilingual-NLI-26lang-2mil7

‍

Linkedin Logo
Marcel Plaschke
Head of Strategy, Sales & Marketing
Beratung vereinbaren
Zugehörige Leistungen
No items found.

Weitere Blogartikel

  • Artificial Intelligence
AI Trends Report 2025: Die 16 Trends im Überblick
Tarik Ashry
05. Februar 2025
Mehr erfahren
  • Artificial Intelligence
  • Data Science
  • Human-centered AI
Explainable AI in der Praxis: Mit der richtigen Methode die Black Box öffnen
Jonas Wacker
15. November 2024
Mehr erfahren
  • Artificial Intelligence
  • Data Science
  • GenAI
Wie ein CustomGPT Effizienz und KreativitÀt bei hagebau fördert
Tarik Ashry
06. November 2024
Mehr erfahren
  • Artificial Intelligence
  • Data Culture
  • Data Science
  • Deep Learning
  • GenAI
  • Machine Learning
AI Trends Report 2024: statworx COO Fabian MĂŒller zieht eine Zwischenbilanz
Tarik Ashry
05. September 2024
Mehr erfahren
  • Artificial Intelligence
  • Human-centered AI
  • Strategy
Der AI-Act ist da – diese Risikoklassen sollte man kennen
Fabian MĂŒller
05. August 2024
Mehr erfahren
  • Artificial Intelligence
  • GenAI
  • statworx
ZurĂŒck in die Zukunft: Die Geschichte von Generativer KI (Episode 4)
Tarik Ashry
31. Juli 2024
Mehr erfahren
  • Artificial Intelligence
  • GenAI
  • statworx
ZurĂŒck in die Zukunft: Die Geschichte von Generativer KI (Episode 3)
Tarik Ashry
24. Juli 2024
Mehr erfahren
  • Artificial Intelligence
  • GenAI
  • statworx
ZurĂŒck in die Zukunft: Die Geschichte von Generativer KI (Episode 2)
Tarik Ashry
17. Juli 2024
Mehr erfahren
  • Artificial Intelligence
  • GenAI
  • statworx
ZurĂŒck in die Zukunft: Die Geschichte von Generativer KI (Episode 1)
Tarik Ashry
10. Juli 2024
Mehr erfahren
  • Artificial Intelligence
  • GenAI
  • statworx
Generative KI als Denkmaschine? Ein medientheoretischer Blick
Tarik Ashry
13. Juni 2024
Mehr erfahren
  • Artificial Intelligence
  • GenAI
  • statworx
Maßgeschneiderte KI-Chatbots: Hohe Leistung und schnelle Integration vereint
Tarik Ashry
10. April 2024
Mehr erfahren
  • Artificial Intelligence
  • Data Culture
  • Human-centered AI
Wie FĂŒhrungskrĂ€fte die Datenkultur im Unternehmen stĂ€rken können
Tarik Ashry
21. Februar 2024
Mehr erfahren
  • Artificial Intelligence
  • Data Culture
  • Human-centered AI
KI in der Arbeitswelt: Wie wir Skepsis in Zuversicht verwandeln
Tarik Ashry
08. Februar 2024
Mehr erfahren
  • Artificial Intelligence
  • Data Science
Wie wir fĂŒr Microsoft einen Chatbot mit echtem Wissen entwickelt haben
Team statworx
27. September 2023
Mehr erfahren
  • Data Science
  • Data Visualization
  • Frontend Solution
Warum Frontend-Entwicklung in Data Science-Anwendungen nĂŒtzlich ist
Jakob Gepp
30. August 2023
Mehr erfahren
  • Artificial Intelligence
  • Human-centered AI
  • statworx
the byte - Wie wir ein KI-gesteuertes Pop-up Restaurant aufgebaut haben
Sebastian Heinz
14. Juni 2023
Mehr erfahren
  • Artificial Intelligence
  • Recap
  • statworx
Big Data & AI World 2023 Recap
Team statworx
24. Mai 2023
Mehr erfahren
  • Data Science
  • Human-centered AI
  • Statistics & Methods
Die Black-Box entschlĂŒsseln – 3 Explainable AI Methoden zur Vorbereitung auf den AI-Act
Team statworx
17. Mai 2023
Mehr erfahren
  • Artificial Intelligence
  • Human-centered AI
  • Strategy
Wie der AI-Act die KI-Branche verĂ€ndern wird: Alles, was man jetzt darĂŒber wissen muss
Team statworx
11. Mai 2023
Mehr erfahren
  • Artificial Intelligence
  • Human-centered AI
  • Machine Learning
Genderdarstellung in der KI – Teil 2: Automatisierte Erzeugung genderneutraler Versionen von Gesichtsbildern
Team statworx
03. Mai 2023
Mehr erfahren
  • Artificial Intelligence
  • Data Science
  • Statistics & Methods
Ein erster Einblick in unser Forecasting Recommender Tool
Team statworx
26. April 2023
Mehr erfahren
  • Artificial Intelligence
  • Data Science
Vom Können, Tun und Wollen – Warum Datenkultur und Death Metal einiges miteinander gemeinsam haben
David Schlepps
19. April 2023
Mehr erfahren
  • Artificial Intelligence
  • Human-centered AI
  • Machine Learning
GPT-4 – Eine Einordnung der wichtigsten Neuerungen
Mareike Flögel
17. MĂ€rz 2023
Mehr erfahren
  • Artificial Intelligence
  • Data Science
  • Strategy
Das Geheimnis der Datenkultur entschlĂŒsseln: Diese Faktoren beeinflussen Kultur und Erfolg von Unternehmen
Team statworx
16. MĂ€rz 2023
Mehr erfahren
  • Artificial Intelligence
  • Deep Learning
  • Machine Learning
Wie man KI-generierte Avatare mit Hilfe von Stable Diffusion und Textual Inversion erstellt
Team statworx
08. MĂ€rz 2023
Mehr erfahren
  • Artificial Intelligence
  • Human-centered AI
  • Strategy
Knowledge Management mit NLP: So einfach verarbeitet man E-Mails mit KI
Team statworx
02. MĂ€rz 2023
Mehr erfahren
  • Artificial Intelligence
  • Deep Learning
  • Machine Learning
3 AnwendungsfÀlle, wie ChatGPT die Kommunikation in Unternehmen revolutionieren wird
Ingo Marquart
16. Februar 2023
Mehr erfahren
  • Recap
  • statworx
Ho ho ho – weihnachtlicher KĂŒchenabriss
Julius Heinz
22. Dezember 2022
Mehr erfahren
  • Artificial Intelligence
  • Deep Learning
  • Machine Learning
Real-time Computer Vision: Gesichter erkennen mit einem Roboter
Sarah Sester
30. November 2022
Mehr erfahren
  • Data Engineering
  • Tutorial
Data Engineering – From Zero to Hero
Thomas Alcock
23. November 2022
Mehr erfahren
  • Recap
  • statworx
statworx @ UXDX Conf 2022
Markus Berroth
18. November 2022
Mehr erfahren
  • Artificial Intelligence
  • Machine Learning
  • Tutorial
Paradigmenwechsel in NLP: 5 AnsÀtze, um bessere Prompts zu schreiben
Team statworx
26. Oktober 2022
Mehr erfahren
  • Recap
  • statworx
statworx @ vuejs.de Conf 2022
Jakob Gepp
14. Oktober 2022
Mehr erfahren
  • Data Engineering
  • Data Science
Überwachung und Protokollierung von Anwendungen und Infrastruktur: Metriken und (Ereignis-)Protokolle
Team statworx
29. September 2022
Mehr erfahren
  • Cloud Technology
  • Data Engineering
  • Data Science
Wie du dein Data Science Projekt fit fĂŒr die Cloud machst
Alexander Broska
14. September 2022
Mehr erfahren
  • Artificial Intelligence
  • Human-centered AI
  • Machine Learning
Geschlechter­darstellung in der KI – Teil 1: Verwendung von StyleGAN zur Erforschung von Geschlechter­vielfalt bei der Bild­bearbeitung
Isabel Hermes
18. August 2022
Mehr erfahren
  • Artificial Intelligence
  • Human-centered AI
statworx AI Principles: Warum wir eigene KI-Prinzipien entwickeln
Team statworx
04. August 2022
Mehr erfahren
  • Data Engineering
  • Data Science
  • Python
Wie Du Deinen Code und Deine AbhÀngigkeiten in Python scannst
Thomas Alcock
21. Juli 2022
Mehr erfahren
  • Data Engineering
  • Data Science
  • Machine Learning
Data-Centric AI: Von Model-First zu Data-First KI-Prozessen
Team statworx
13. Juli 2022
Mehr erfahren
  • Artificial Intelligence
  • Deep Learning
  • Human-centered AI
  • Machine Learning
DALL-E 2: Warum Diskriminierung in der KI-Entwicklung nicht ignoriert werden kann
Team statworx
28. Juni 2022
Mehr erfahren
  • R
Das helfRlein Package – Eine Sammlung nĂŒtzlicher Funktionen
Team statworx
23. Juni 2022
Mehr erfahren
  • Recap
  • statworx
Unfold 2022 in Bern – by Cleverclip
Team statworx
11. Mai 2022
Mehr erfahren
  • Artificial Intelligence
  • Data Science
  • Human-centered AI
  • Machine Learning
Vorurteile in KI abbauen
Team statworx
08. MĂ€rz 2022
Mehr erfahren
  • Artificial Intelligence
  • Cloud Technology
  • Data Science
  • Sustainable AI
Wie du als Data Scientist deinen KI CO₂ Fußabdruck verringerst
Team statworx
02. Februar 2022
Mehr erfahren
  • Recap
  • statworx
2022 und die Reise zu statworx next
Sebastian Heinz
06. Januar 2022
Mehr erfahren
  • Recap
  • statworx
5 Highlights vom Digital Festival ZĂŒrich 2021
Team statworx
25. November 2021
Mehr erfahren
  • Data Science
  • Human-centered AI
  • Machine Learning
  • Strategy
Warum Data Science und KI-Initiativen scheitern – eine Reflektion zu nicht-technischen Faktoren
Team statworx
22. September 2021
Mehr erfahren
  • Artificial Intelligence
  • Data Science
  • Human-centered AI
  • Machine Learning
  • statworx
Kolumne: Mensch und Maschine Seite an Seite
Sebastian Heinz
03. September 2021
Mehr erfahren
  • Coding
  • Data Science
  • Python
Wie man mit Call Graph automatisch Projektgrafiken erstellt
Team statworx
25. August 2021
Mehr erfahren
  • Coding
  • Python
  • Tutorial
statworx Cheatsheets – Python Basics Cheatsheet fĂŒr Data Science
Team statworx
13. August 2021
Mehr erfahren
  • Data Science
  • statworx
  • Strategy
STATWORX meets DHBW – Data Science Real-World Use Cases
Team statworx
04. August 2021
Mehr erfahren
  • Data Engineering
  • Data Science
  • Machine Learning
Machine Learning Modelle bereitstellen und skalieren mit Kubernetes
Team statworx
29. Juli 2021
Mehr erfahren
  • Cloud Technology
  • Data Engineering
  • Machine Learning

‍

3 Szenarien zum Deployment von Machine Learning Workflows mittels MLflow
Team statworx
30. Juni 2021
Mehr erfahren
  • Artificial Intelligence
  • Deep Learning
  • Machine Learning

‍

Car Model Classification III: ErklÀrbarkeit von Deep Learning Modellen mit Grad-CAM
Team statworx
19. Mai 2021
Mehr erfahren
  • Artificial Intelligence
  • Coding
  • Deep Learning
Car Model Classification II: Deployment von TensorFlow-Modellen in Docker mit TensorFlow Serving
Team statworx
12. Mai 2021
Mehr erfahren
  • Coding
  • Deep Learning
Car Model Classification I: Transfer Learning mit ResNet
Team statworx
05. Mai 2021
Mehr erfahren
  • Artificial Intelligence
  • Deep Learning
  • Machine Learning
Car Model Classification IV: Integration von Deep Learning Modellen mit Dash
Dominique Lade
05. Mai 2021
Mehr erfahren
  • AI Act
Potenzial noch nicht ausgeschöpft – Ein Kommentar zur vorgeschlagenen KI-Regulierung der EU
Team statworx
Mehr erfahren
  • Artificial Intelligence
  • Deep Learning
  • statworx
Creaition – Revolutionierung des Designprozesses mit Machine Learning
Team statworx
31. MĂ€rz 2021
Mehr erfahren
  • Artificial Intelligence
  • Data Science
  • Machine Learning
5 Typen von Machine Learning Algorithmen (Mit Anwendungsfällen)
Team statworx
24. MĂ€rz 2021
Mehr erfahren
  • Recaps
  • statworx
2020 – Ein RĂŒckblick fĂŒr mich und GPT-3
Sebastian Heinz
23. Dezember 2020
Mehr erfahren
  • Artificial Intelligence
  • Deep Learning
  • Machine Learning
5 praxisnahe Beispiele fĂŒr NLP Use Cases
Team statworx
12. November 2020
Mehr erfahren
  • Data Science
  • Deep Learning
Die 5 wichtigsten Use Cases fĂŒr Computer Vision
Team statworx
05. November 2020
Mehr erfahren
  • Data Science
  • Deep Learning
Neue Trends im Natural Language Processing – Wie NLP massentauglich wird
Dominique Lade
29. Oktober 2020
Mehr erfahren
  • Data Engineering
5 Technologien, die jeder Data Engineer kennen sollte
Team statworx
22. Oktober 2020
Mehr erfahren
  • Artificial Intelligence
  • Data Science
  • Machine Learning
Generative Adversarial Networks: Wie mit Neuronalen Netzen Daten generiert werden können
Team statworx
15. Oktober 2020
Mehr erfahren
  • Coding
  • Data Science
  • Deep Learning
Finetuning von Tesseract-OCR fĂŒr deutsche Rechnungen
Team statworx
08. Oktober 2020
Mehr erfahren
  • Artificial Intelligence
  • Machine Learning
Whitepaper: Ein Reifegradmodell fĂŒr KĂŒnstliche Intelligenz
Team statworx
06. Oktober 2020
Mehr erfahren
  • Data Engineering
  • Data Science
  • Machine Learning
Machine Learning Modelle mit Hilfe von Docker Containern bereitstellen
Thomas Alcock
01. Oktober 2020
Mehr erfahren
  • Recap
  • statworx
STATWORX 2.0 – Das neue Headquarter in Frankfurt ist eröffnet
Julius Heinz
24. September 2020
Mehr erfahren
  • Machine Learning
  • Python
  • Tutorial
Wie man eine Machine Learning API mit Python und Flask erstellt
Team statworx
29. Juli 2020
Mehr erfahren
  • Data Science
  • Statistics & Methods
Modellregularisierung – The Bayesian Way
Thomas Alcock
15. Juli 2020
Mehr erfahren
  • Recap
  • statworx
Auf zu neuen Abenteuern: Soft Opening des STATWORX BĂŒros
Team statworx
14. Juli 2020
Mehr erfahren
  • Data Engineering
  • R
  • Tutorial
Wie Du ShinyApps in Docker-Images einbauen kannst
Team statworx
15. Mai 2020
Mehr erfahren
  • Coding
  • Python
Making Of: Eine kostenlose API fĂŒr COVID-19-Daten
Sebastian Heinz
01. April 2020
Mehr erfahren
  • Frontend
  • Python
  • Tutorial
Wie Du ein Dashboard In Python baust – Plotly Dash Step-by-Step Tutorial
Alexander Blaufuss
26. MĂ€rz 2020
Mehr erfahren
  • Coding
  • R
Warum heißen sie so?! – Ursprung und Bedeutung von R-Paketnamen
Team statworx
19. MĂ€rz 2020
Mehr erfahren
  • Data Visualization
  • R
Gemeinschaftsdetektion mit Louvain und Infomap
Team statworx
04. MĂ€rz 2020
Mehr erfahren
  • Coding
  • Data Engineering
  • Data Science
Testen von REST-APIs mit Newman
Team statworx
26. Februar 2020
Mehr erfahren
  • Coding
  • Frontend
  • R
Dynamische UI-Elemente in Shiny - Teil 2
Team statworx
19. Februar 2020
Mehr erfahren
  • Coding
  • Data Visualization
  • R
Animierte Plots mit ggplot und gganimate
Team statworx
14. Februar 2020
Mehr erfahren
  • Machine Learning
Machine Learning Goes Causal II: Der kausale Bruder des Random Forests
Team statworx
05. Februar 2020
Mehr erfahren
  • Artificial Intelligence
  • Machine Learning
  • Statistics & Methods
Machine Learning Goes Causal I: Warum KausalitÀt wichtig ist
Team statworx
29.01.2020
Mehr erfahren
  • Data Engineering
  • R
  • Tutorial
Wie man REST-APIs mit R Plumber erstellt
Stephan Emmer
23. Januar 2020
Mehr erfahren
  • Recaps
  • statworx
statworx 2019 – Ein JahresrĂŒckblick
Sebastian Heinz
20. Dezember 2019
Mehr erfahren
  • Artificial Intelligence
  • Deep Learning
Deep Learning – Überblick und Einstieg
Team statworx
04. Dezember 2019
Mehr erfahren
  • Coding
  • Machine Learning
  • R
Abstimmung von Random Forest auf Zeitreihendaten
Team statworx
21. November 2019
Mehr erfahren
  • Data Science
  • R
Kombination von PreiselastizitÀten und Verkaufsprognosen zur Verkaufssteigerung
Team statworx
06. November 2019
Mehr erfahren
  • Data Engineering
  • Python
Von ĂŒberall aus auf deinen Spark-Cluster zugreifen – mit Apache Livy
Team statworx
30. Oktober 2019
Mehr erfahren
  • Recap
  • statworx
STATWORX auf Tour: Wein, Burgen & Wandern!
Team statworx
18. Oktober 2019
Mehr erfahren
  • Data Science
  • R
  • Statistics & Methods
Wie man eine Kreuzvalidierung zur Evaluation der Modellperformance von Grund auf selbst erstellt
Team statworx
02. Oktober 2019
Mehr erfahren
  • Data Science
  • Machine Learning
  • R
Zeitreihenvorhersage mit Random Forest
Team statworx
25. September 2019
Mehr erfahren
  • Coding
  • Frontend
  • R
Dynamische UI Elemente in Shiny – Teil 1
Team statworx
11. September 2019
Mehr erfahren
  • Machine Learning
  • R
  • Statistics & Methods
Was dem MAPE fÀlschlicherweise vorgeworfen wird, seine WAHREN SchwÀchen und BESSERE Alternativen!
Team statworx
16. August 2019
Mehr erfahren
  • Coding
  • Python
Web Scraping 101 in Python mit Requests & BeautifulSoup
Team statworx
31. Juli 2019
Mehr erfahren
  • Coding
  • Frontend
  • R
Einstieg in Flexdashboards in R
Thomas Alcock
19. Juli 2019
Mehr erfahren
  • Recap
  • statworx
statworx Sommer-Barbecue 2019
Team statworx
21. Juni 2019
Mehr erfahren
  • Data Visualization
  • R
Interaktive Netzwerkvisualisierung mit R
Team statworx
12. Juni 2019
Mehr erfahren
  • Deep Learning
  • Python
  • Tutorial
Verwendung von Reinforcement Learning zum Spielen von Super Mario Bros auf NES mit TensorFlow
Sebastian Heinz
29. Mai 2019
Mehr erfahren
  • Coding
  • Data Engineering
Automatisierte Erstellung von Docker Containern
Stephan Emmer
10. Mai 2019
Mehr erfahren
This is some text inside of a div block.
This is some text inside of a div block.