Zurück zu allen Case Studies

|

Effizienzsteigerung durch automatisierte Extraktion von Daten aus PDF-Dokumenten

Health & Pharma
GenAI

In diesem Projekt ermöglichte KI automatisierte Extraktion relevanter Daten aus PDF-Dokumenten von klinischen Studien, was zu einer 500-fachen Geschwindigkeitssteigerung, präziseren Ergebnissen und einer signifikanten Reduzierung des manuellen Aufwands führte.

Herausforderung

Klinische Studien sind ein wichtiger Bestandteil bei der Entwicklung von Medikamenten. Die Dokumentation und Ergebnisse dieser Studien fallen in Form von Studienberichten häufig unstrukturiert an – z.B. verschriftlicht in Form von PDF-Dokumenten. Insbesondere bei größer angelegten Studien mit vielen beteiligten Parteien entsteht zusätzliche Arbeit dadurch, dass zentrale Erkenntnisse und Prozess-Parameter später aus den PDF-Dokumenten ausgelesen und in strukturierte Datenbanken abgelegt werden müssen. Im Fall unseres Kunden, erfolgte diese repetitive Arbeit manuell durch Expert:innen. Das Ziel des Projekts bestand darin, durch eine automatisierte Extraktion sämtlicher relevanter Daten aus den PDF-Dokumenten die manuelle Arbeit zu minimieren und dadurch den Prozess erheblich zu beschleunigen.

Ansatz

Die Extraktion von Informationen aus Texten wird als sogenannte Named-Entity-Recognition bezeichnet. Um diese umzusetzen, haben wir ein Domänen-spezifisches vortrainiertes Sprachmodell auf 20 relevante „Entitäten“ (u.a. Name des Präparates, Start und Ende einer Versuchsreihe) antrainiert. Dadurch ist das Sprachmodell in der Lage diese Entitäten automatisch in neuen Texten zu erkennen und zu extrahieren. Die dadurch gefundenen Daten können anschließend in eine strukturierte Datenbank abgelegt werden. Um eine gute Balance aus Genauigkeit der Erkennung und Transparenz der Ergebnisse zu erhalten, wurden zudem regelbasierte Ansätze hinzugefügt. Dadurch konnte eine hohe Richtig-Positiv-Rate bei gleichzeitig geringer Falsch-Negativ-Rate erreicht werden.

Ergebnis

Dank des Einsatzes von KI konnte eine um etwa 500-fach schnellere Extraktion der notwendigen Daten aus den PDF-Dokumenten erreicht werden. Zudem haben Bewertungen von Expert:innen gezeigt, dass die automatisierte Extraktion präziser ist als die zuvor manuell durchgeführte Extraktion. Im Rahmen des 3-monatigen Projekts wurde nicht nur der Gesamtprozess der Datenerfassung signifikant beschleunigt und der manuelle Aufwand deutlich reduziert, sondern auch die Qualität der Datenerfassung nachhaltig verbessert.

“

Jetzt die ganze Case Study kostenlos herunterladen

Marcel Plaschke

Head of Strategy, Sales & Marketing

Beratung vereinbaren

Kunde

Thema

GenAI

,

Branche

Health & Pharma

Tools

Python

,

Azure

,

Huggingface

,

PyTorch

,

Projektdauer

3 Monate

Zugehörige Leistungen

Case Study herunterladen

Weitere umgesetzte Case Studies

Optimierung der Rechnungsstellung durch KI-gestützte Empfehlungen

17.7.2025

Semantische Suchmaschine für R-Code

10.7.2025

Empfehlungssystem
NLP

Entwicklung eines maßgeschneiderten Empfehlungssystems für personalisierte Medieninhalte

2.7.2025

Forecasting

Optimierte Liquiditätsprognosen dank Forecasting Engine

11.2.2025

NLP
Training

LLM-Workshop und Inhouse-Datenanalysen für Experts

8.1.2025

Other
Customer Analytics

Vorhersage von Online-Upselling

20.1.2022

Insurance
Customer Analytics

Vorhersage von Customer Churn

20.1.2022

Insurance
Customer Analytics

Upselling von Versicherungen

20.1.2022

Transport & Logistics
Pricing Analytics

Dynamic Pricing in der Luftfahrt

20.1.2022

Retail & Consumer
Forecasting

Optimierung Disposition Retail

20.1.2022

Transport & Logistics
Forecasting

Demand Forecasting Logistik

20.1.2022

Retail & Consumer
Forecasting

Sales Forecasting mit Deep Learning

20.1.2022

Retail & Consumer
Pricing Analytics

Preiselastizitäten im Retail

20.1.2022

Transport & Logistics
Forecasting

Predictive Steering in der Luftfahrt-Industrie

20.1.2022

Automotive
NLP

Procurement-Suite

20.1.2022

Transport & Logistics
Forecasting
Frontend Solution

Analyse von Güterverkehrsströmen in R Shiny

20.1.2022

Health & Pharma
Strategy

AI Use Case Workshop

20.1.2022

Other
NLP

Session Daten Analyse

20.1.2022

Retail & Consumer
Other

Marketing-Analyse

20.1.2022

Insurance
Forecasting

Sales Forecasting

20.1.2022

Automotive
Frontend Solution
MLOps

Applikation zur Erstellung von Risiko-Reportings

20.1.2022

Insurance
Strategy

Data Science Strategiekonzept

20.1.2022

Automotive
Strategy

Operating Model

20.1.2022

Health & Pharma
NLP

Covid Research Support with NLP

20.1.2022

Retail & Consumer
Customer Analytics

Next Basket Prediction mit Deep Learning

20.1.2022

Retail & Consumer
Customer Analytics
Explainable AI

Customer Churn & Retention Prognose

20.1.2022

Industry
Customer Analytics

Customer Analytics Suite

20.1.2022

Automotive
MLOps

Automatisierte Bereitstellung von R Shiny Applikationen

20.1.2022

Insurance
Customer Analytics

Prognose von Online Conversions

20.1.2022

Insurance
Customer Analytics

Prognose Next Best Product

20.1.2022

Automotive
Quality Analytics

Prognose von Qualitätsproblemen

20.1.2022

Retail & Consumer
Anomaly Detection

Anomalieerkennung in Retail-Daten

20.1.2022

Energy
Forecasting

Load Forecasting mit Deep Learning

20.1.2022

Telecom
Fraud Detection

Identifikation von Bot Calls

20.1.2022

Retail & Consumer
Forecasting

Sales Forecasting im Retail

20.1.2022

Finance
Other

Event Study von Aktienportfolios

20.1.2022

Automotive
Forecasting

Sales Forecasting Automotive

20.1.2022

Retail & Consumer
Pricing Analytics

Pricing Analytics im Retail

20.1.2022

Automotive
Customer Analytics

Kundensegmentierung Automotive

20.1.2022

Telecom
Training

Data Science Workshop Telekommunikation

20.1.2022

Transport & Logistics
Forecasting
Frontend Solution

R Shiny App zur Logistik-Disposition

20.1.2022

Transport & Logistics
Forecasting

Skalierung von Forecasting-Modellen

20.1.2022

Health & Pharma
Quality Analytics

Qualitätsanalyse in der Endoprothetik

20.1.2022

Health & Pharma
Quality Analytics

Limit of Detection Analyse Medical Devices

20.1.2022

Transport & Logistics
Forecasting

Vorhersage von Flugverspätungen

20.1.2022

Automotive
Customer Analytics
Frontend Solution

Big Data Analysetool Automotive

20.1.2022

Automotive
Customer Analytics
Frontend Solution

Big Data Analysis Dashboard

20.1.2022

Automotive
Training

Abteilungsweites Data & Analytics Trainingskonzept

20.1.2022

Health & Pharma
Training

Financial Analyst ML Training

20.1.2022

Finance
Training

Data Science Training

20.1.2022

Other
Training

Deep Learning Training

20.1.2022

Automotive
MLOps

Einführung Kubernetes Betriebsplattform

20.1.2022

Health & Pharma
MLOps

Data Product Operationalization

21.1.2022

Finance
Strategy

Data Science Plattformstrategie

21.1.2022

Automotive
Forecasting

Restwertprognose für Leasingfahrzeuge

21.1.2022

Automotive
Pricing Analytics

Discount Optimization

22.1.2022

Retail & Consumer
Recommendation Systems

Recommender-System im E-Commerce

22.1.2022

Automotive
Explainable AI
Forecasting

Time Series Forecasting Engine

22.1.2022

Other
NLP

Social Media Recruiting mit NLP

22.1.2022

Telecom
Anomaly Detection

Anomalieerkennung in VoIP-Netzwerken

22.1.2022

Insurance
GenAI

Entwicklung eines interaktiven Chatbots zur effizienten Schadensregulierung von Flottenfahrzeugen

15.7.2024

Transport & Logistics
Pricing Analytics

Dynamic Pricing mit Reinforcement Learning

20.1.2022

Automotive
Forecasting

Demand Forecasting

20.12.2024

Health & Pharma
Strategy

OpsModel Skalierungskonzept

20.1.2022

Aviation
Pricing Analytics

Marktsegmentierung in der Luftfahrt

22.1.2022

Retail & Consumer
Explainable AI
Frontend Solution
Pricing Analytics

Preissimulation im Retail

20.1.2022

Automotive
Forecasting

Prognose von Investitionskosten

22.1.2022

Other
Computer Vision

KI-basierte Handschriftenerkennung

30.9.2022

Industry
GenAI

Echtzeithilfe für den Kundenservice: Wie GenAI den Customer Support revolutioniert

15.10.2023

Other
Computer Vision
Explainable AI

Verschlagwortung mit Hilfe von Deep Learning

30.9.2022

Automotive
Recommendation Systems

Supplier Recommendation Tool

10.11.2022

Health & Pharma
Computer Vision

Schneller und präziser zur automatisierten Tumorerkennung

4.4.2024

Health & Pharma
Training

KI & Data Literacy Training

30.10.2022

Automotive
Predicitive Maintenance

Predictive Maintenance in Automotive

20.10.2022

Automotive
Customer Analytics

EBIT Forecasting

22.11.2022

Industry
Customer Analytics

Klassifikation E-Mails im Customer Support

20.12.2022

Health & Pharma
GenAI

Effizienzsteigerung in der Softwareentwicklung mit Hilfe generativer KI

21.7.2023

Other
GenAI

Verbesserte Empfehlungen von Fachliteratur mit Hilfe von GenAI

24.7.2023

Health & Pharma
GenAI

Personalisierte Weiterentwicklung von Mitarbeitenden mit Hilfe von generativer KI

24.7.2023

Automotive
Data Engineering

Einführung eines Frameworks zur Datenintegration bei einem Automobilhersteller

7.6.2024

Automotive
Data Engineering
Frontend Solution
Pricing Analytics

Optimierung der Supply-Chain-Pricing-Strategie für einen Automobilzulieferer

7.6.2024

Energy
Data Engineering
Frontend Solution

Implementierung einer Datenanalyseplattform für erneuerbare Energien

7.6.2024

Automotive
Data Engineering
Recommendation Systems

Steigerung der In-Car-Service-Verkäufe durch ein personalisiertes Empfehlungssystem

7.6.2024

Industry
Anomaly Detection
GenAI

Optimierung der Produktionsprozesse durch KI-gestützte Anomalieerkennung

11.7.2024

Health & Pharma
Deep Learning

KI-basierte Erkennung von Wechselwirkungen zwischen Medikamenten

18.7.2024

Other
Strategy

Entwicklung einer Datenstrategie

22.7.2024

Other
Frontend Solution
GenAI

KI in der Bildung: Texte effizienter erstellen und bewerten

29.7.2024

Finance
Strategy

KI-Strategie für ein Private Equity Unternehmen

6.8.2024

Industry
GenAI

ChatGPT & RAG: Wissensmanagement und generative KI vereint

13.8.2024

Health & Pharma
Frontend Solution
GenAI
Data Culture

Implementierung einer Image Prompting Challenge im Pharma-Sektor

20.8.2024

Automotive
Reporting

Eine einheitliche Reporting-Plattform für einen Automobilhersteller

3.9.2024

Health & Pharma
Training
Data Culture

Data Quality Challenge: Datenqualität im Fokus

11.9.2024

Automotive
Frontend Solution

Effiziente Fahrzeugflottenplanung durch Frontend-Datenvisualisierung

16.9.2024

Energy
Frontend Solution

Wie eine Monitoring-App die Angebotsbearbeitung optimiert

26.9.2024

Other
Strategy

KI-Strategie: Wie ein Mittelständler seine Top-KI-Use-Cases ermittelt

1.10.2024

Other
Strategy

KI Use Cases strategisch entwickeln und umsetzen

8.10.2024

Finance
Strategy

KI-Strategie für eine Landesbank

15.10.2024

Automotive
GenAI

Produktionsdatenanalyse mit personalisiertem KI-Assistenten

24.10.2024

Health & Pharma
NLP

Intelligente Ereignisanalyse und Informationssuche mit KI

12.11.2024

Health & Pharma
Strategy

Konzeption einer Datenstrategie für eine führende Klinik

25.11.2024