de
                    array(1) {
  ["de"]=>
  array(13) {
    ["code"]=>
    string(2) "de"
    ["id"]=>
    string(1) "3"
    ["native_name"]=>
    string(7) "Deutsch"
    ["major"]=>
    string(1) "1"
    ["active"]=>
    string(1) "1"
    ["default_locale"]=>
    string(5) "de_DE"
    ["encode_url"]=>
    string(1) "0"
    ["tag"]=>
    string(2) "de"
    ["missing"]=>
    int(0)
    ["translated_name"]=>
    string(7) "Deutsch"
    ["url"]=>
    string(110) "https://www.statworx.com/case-studies/effizienzsteigerung-in-der-softwareentwicklung-mit-hilfe-generativer-ki/"
    ["country_flag_url"]=>
    string(87) "https://www.statworx.com/wp-content/plugins/sitepress-multilingual-cms/res/flags/de.png"
    ["language_code"]=>
    string(2) "de"
  }
}
                    
Kontakt
Case Studies
Case Studies

Effizienzsteigerung in der Softwareentwicklung mit Hilfe generativer KI

Um den Aufwand für die Datenintegration zu verringern, haben wir für unseren Kunden ein Sprachmodell entwickelt, mit dem bestehender Programmiercode besser durchsucht und Vorschläge generiert werden können.

  • Branche Health & Pharma
  • Thema GenAI
  • Tools Python, PyTorch, HuggingFace
  • Projektdauer 6 Monate
Laptop mit Händen und Medikamenten

Herausforderung

In der Erforschung und Entwicklung neuer Medikamente fallen im Laufe des Prozesses unzählige Daten an. Insbesondere im Rahmen von klinischen Studien stand unser Kunde dabei vor der Herausforderung, dass die erhobenen Daten wenig standardisiert und dokumentiert sind. Um neue Daten zu erschließen, muss daher viel Arbeit in die Integration von nicht-standardisierten Daten investiert werden. Der dazu notwendige Programmiercode wird im Rahmen der Integration jedes Mal neu manuell erstellt. Um diesen Prozess zu beschleunigen und die Fragmentierung der Codebasis zu reduzieren, wurde ein neuer innovativer Ansatz mit hohem Automatisierungspotenzial gesucht.

Ansatz

Große Sprachmodelle bieten mittlerweile nicht nur ein sehr gutes Verständnis natürlicher Sprache, sondern sind auch in der Lage eine Vielzahl von Programmiersprachen zu verstehen und sogar zu generieren. Darüber hinaus können diese Modelle auch dazu verwendet werden, natürliche Sprache in Programmiersprache zu „übersetzen“. Da die spezifische Programmiersprache unseres Kunden unterrepräsentiert war, haben wir ein vortrainiertes Sprachmodell auf seine Daten (Programmiercode und Dokumentationen) weiter trainiert. Dadurch konnte das Modell ein semantisches Verständnis dieser kundenspezifischen Codebasis erlernen. Nach der Integration in eine Suchmaschine kann das Modell nun nach ähnlichen Code-Bestandteilen suchen oder diese anhand vorhandener Beispiele erstellen.

Ergebnis

Durch die Kombination eines angepassten Sprachmodells mit einer semantischen Suche konnte der Prozess der Datenintegration deutlich beschleunigt und qualitativ verbessert werden. Dies ist möglich, indem neuer Programmiercode nicht von der ersten Zeile an generiert werden muss, sondern eine hohe Wiederverwertbarkeit des bestehenden Codes erreicht werden konnte. Die beteiligten Entwickler:innen können so bereits implementiere Funktionalitäten schnell finden, wiederverwenden und sogar automatisiert anpassen lassen. Durch die Wiederverwendbarkeit des Codes wird zudem eine zunehmende Fragmentierung durch immer neue Funktionalitäten und doppelte Strukturen reduziert.

Experte

Kontakt anfragen

Erfahre mehr!

Als eines der führenden Unternehmen im Bereich Data Science, Machine Learning und KI begleiten wir Sie in die datengetriebene Zukunft. Erfahren Sie mehr über statworx und darüber, was uns antreibt.
ÜBER UNS