Semantische Suchmaschine für R-Code
Wir entwickelten eine semantische Suchmaschine für ein führendes Pharmaunternehmen, die durch natürliche Sprachabfragen relevante R-Code-Schnipsel identifiziert und so die Entwickler-Effizienz verbessert.

Herausforderung
Die spezifischen Herausforderungen bestanden darin, dass vorhandene Suchmethoden für Code meist auf lexikalischen Ansätzen basieren und Schwierigkeiten haben, die semantische Bedeutung der Suchanfragen zu erfassen. Dies führte oft zu ungenauen oder irrelevanten Ergebnissen. Eine Lösung war notwendig, um die Suchpräzision zu erhöhen und die Entwickler-Effizienz zu verbessern.
Ansatz
Der entwickelte Lösungsansatz beinhaltete die Feinabstimmung eines vortrainierten Transformer-Modells, das für die Codesuche optimiert wurde. Dabei wurden Methoden der maschinellen Lernens und Natural Language Processing eingesetzt, um die semantische Analyse der Suchanfragen zu ermöglichen. Die Implementierung umfasste auch die Filterung doppelter Suchergebnisse und die Neubewertung der Suchergebnisse durch ein zusätzliches Modell für bestmögliche Empfehlungen.
Ergebnis
Die erzielten Ergebnisse umfassten die erfolgreiche Überprüfung der Machbarkeit der semantischen Suche und deren Überlegenheit gegenüber klassischen Ansätzen. Das Modell übertraf alle verfügbaren vortrainierten Modelle in der Suchpräzision und verbesserte die Entwickler-Effizienz erheblich. Durch die semantische Analyse konnten relevante Code-Ausschnitte präziser identifiziert und vorgeschlagen werden, was den Entwicklungsprozess beschleunigte und optimierte.