30% Juni 2026 Aktion nur bis zum 30.6. Code: JUNI26 Yes, ich bin interessiert! 🚀

PwC und AWS automatisieren Vertragsanalyse mit KI auf Amazon

· Published on 08.05.2026

TL;DR: PwC hat gemeinsam mit AWS eine serverlose KI-Architektur für die automatisierte Vertragsanalyse entwickelt – und zeigt damit, wie Enterprise-grade Document Intelligence in der Cloud aussieht, wenn sie wirklich produktionsreif ist.

Vertragsanalyse gehört zu den ressourcenintensivsten Aufgaben in Legal-, Compliance- und Procurement-Teams. Hunderte Seiten unstrukturierter Agreements, wiederkehrende Clause-Checks, manuell aufgebaute Extraktionsprozesse – das alles skaliert schlecht. PwC hat dieses Problem mit der eigenen Lösung AIDA (AI-driven annotation) adressiert und sie vollständig auf AWS-Cloud-Diensten aufgebaut. Der AWS Machine Learning Blog dokumentiert die Architektur und den Ansatz im Detail.

Was ist neu?

AIDA verbindet drei Kernfähigkeiten: Template-basierte Extraktion, bei der Nutzer einmalig Extraktionsregeln definieren und diese dann konsistent auf tausende Verträge anwenden; Document-level Chat, mit dem Teams via Natural Language direkt im Vertragskontext fragen können; sowie Global Chat, der Fragen über mehrere Dokumente hinweg beantwortet und gezielt auf Subsets eingrenzen lässt.

Technisch läuft alles serverlos und cloud-native: Amazon ECS Fargate für die asynchrone OCR- und Extraktionsverarbeitung, Amazon Bedrock als LLM-Plattform für Inference und RAG-basierte Antwortgenerierung, Amazon OpenSearch Serverless als Vektorindex für semantisches Retrieval, Amazon RDS für strukturierte Ergebnisspeicherung und Amazon S3 als zentrales Dokumentenarchiv. Amazon Bedrock Knowledge Bases übernimmt das Grounding der Modellantworten in den tatsächlichen Vertragstext – inklusive verlinkter Quelltextverweise. Amazon Bedrock Guardrails sichern PII-Filterung, Content-Policy und Prompt-Safety ab. Das Ergebnis: eine vollständig auditierbare, enterprise-fähige Architektur.

In produktiven Deployments hat AIDA die manuelle Reviewzeit bei einem großen Film- und TV-Studio um bis zu 90 % reduziert – konkret bei der Extraktion von IP-Rechten aus Lizenzverträgen.

Was bedeutet das für Teams und Tech Leads?

Für Teams und Tech Leads ist vor allem relevant, dass diese Architektur kein Proof of Concept ist, sondern eine reproduzierbare Blaupause für Document-Intelligence-Systeme auf AWS. Amazon Bedrock positioniert sich dabei als zentraler Platform-Layer: LLM-Hosting, Guardrails, Knowledge Bases und Embeddings unter einem Dach, mit klaren Compliance- und Security-Eigenschaften – was gerade für regulierte Branchen wie Finance, Legal oder Healthcare entscheidend ist.

Der RAG-Ansatz ist bemerkenswert pragmatisch umgesetzt: Statt proprietärer Indizierung setzt PwC auf OpenSearch Serverless als Vektordatenbank, kombiniert mit impliziter semantischer und expliziter Metadaten-Filterung. Das macht das System sowohl für explorative Anfragen als auch für streng eingegrenzte Compliance-Checks einsetzbar. Die Integration downstream via AWS Lambda, EventBridge und SQS in CLM-Systeme, ERPs oder Datenwarenhäuser ist ebenfalls vorgedacht.

Für CTOs und Architekten, die eigene Document-Intelligence-Projekte evaluieren, liefert dieser Beitrag eine konkrete Referenzarchitektur – mit klaren Aussagen zu Skalierung, Sicherheitsebenen und operativem Overhead.

Written by

Hey! Ich bin Robin Böhm – Software-Enthusiast, Autor, Berater und Gründer mit Fokus auf Web und Künstliche Intelligenz. Ich helfe Menschen und Unternehmen, moderne Technologien praktisch einzusetzen – von JavaScript und Angular bis hin zu KI-Systemen und Automatisierung. Mein Schwerpunkt liegt dabei bewusst nicht auf der Entwicklung oder dem Training komplexer Modelle, sondern auf der konkreten Anwendung: Wie lassen sich mit vorhandenen KI-Technologien echte Probleme lösen, Prozesse automatisieren und messbarer Mehrwert schaffen? Ich glaube daran, dass die größten Potenziale dort entstehen, wo Menschen KI direkt in ihrem Arbeitsalltag einsetzen. **Stationen:** - 2012: Bachelorarbeit mit frühen Berührungspunkten zu Künstlicher Intelligenz - 2013: Gründung von Angular.DE - 2013: Autor des ersten deutschen Angular-Buchs - 2014: Gründung von Symetics (heute Workshops.DE) - 2015: Übernahme von reactjs.de von unseren Freunden bei 9elements - 2017: Gründung von VueJS.DE - 2018: Entwicklung eines KI-basierten Prototyps zur Generierung von Lernvideos - 2019: Start der Konferenzreihen NG-DE und VueJS Conf (über 1000 Teilnehmende) - 2020: Gründung der Coding Bootcamps Europe GmbH (AZAV-geförderte Ausbildungen) - 2023: Strategischer Fokuswechsel von Webentwicklung hin zu KI-Technologien - 2024: Gründung von ai-automation-engineers.de (KI-News und Praxiswissen) Heute vermittle ich praxisnah, wie Teams mit KI-gestützten Workflows, Agenten-Systemen und Automatisierung ihre tägliche Arbeit effizienter und wirkungsvoller gestalten können.

From knowledge to success.
Start your training now!
"The trainers are absolute professionals and convey their enthusiasm for the topic. Our employees benefit from intensive, hands-on trainings tailored to their needs. The feedback has been outstanding."
Annika Stille, Head of Internal Training at adesso SE
Annika Stille
Head of Internal Training, adesso SE