PwC und AWS automatisieren Vertragsanalyse mit KI auf Amazon
TL;DR: PwC hat gemeinsam mit AWS eine serverlose KI-Architektur für die automatisierte Vertragsanalyse entwickelt – und zeigt damit, wie Enterprise-grade Document Intelligence in der Cloud aussieht, wenn sie wirklich produktionsreif ist.
Vertragsanalyse gehört zu den ressourcenintensivsten Aufgaben in Legal-, Compliance- und Procurement-Teams. Hunderte Seiten unstrukturierter Agreements, wiederkehrende Clause-Checks, manuell aufgebaute Extraktionsprozesse – das alles skaliert schlecht. PwC hat dieses Problem mit der eigenen Lösung AIDA (AI-driven annotation) adressiert und sie vollständig auf AWS-Cloud-Diensten aufgebaut. Der AWS Machine Learning Blog dokumentiert die Architektur und den Ansatz im Detail.
Was ist neu?
AIDA verbindet drei Kernfähigkeiten: Template-basierte Extraktion, bei der Nutzer einmalig Extraktionsregeln definieren und diese dann konsistent auf tausende Verträge anwenden; Document-level Chat, mit dem Teams via Natural Language direkt im Vertragskontext fragen können; sowie Global Chat, der Fragen über mehrere Dokumente hinweg beantwortet und gezielt auf Subsets eingrenzen lässt.
Technisch läuft alles serverlos und cloud-native: Amazon ECS Fargate für die asynchrone OCR- und Extraktionsverarbeitung, Amazon Bedrock als LLM-Plattform für Inference und RAG-basierte Antwortgenerierung, Amazon OpenSearch Serverless als Vektorindex für semantisches Retrieval, Amazon RDS für strukturierte Ergebnisspeicherung und Amazon S3 als zentrales Dokumentenarchiv. Amazon Bedrock Knowledge Bases übernimmt das Grounding der Modellantworten in den tatsächlichen Vertragstext – inklusive verlinkter Quelltextverweise. Amazon Bedrock Guardrails sichern PII-Filterung, Content-Policy und Prompt-Safety ab. Das Ergebnis: eine vollständig auditierbare, enterprise-fähige Architektur.
In produktiven Deployments hat AIDA die manuelle Reviewzeit bei einem großen Film- und TV-Studio um bis zu 90 % reduziert – konkret bei der Extraktion von IP-Rechten aus Lizenzverträgen.
Was bedeutet das für Teams und Tech Leads?
Für Teams und Tech Leads ist vor allem relevant, dass diese Architektur kein Proof of Concept ist, sondern eine reproduzierbare Blaupause für Document-Intelligence-Systeme auf AWS. Amazon Bedrock positioniert sich dabei als zentraler Platform-Layer: LLM-Hosting, Guardrails, Knowledge Bases und Embeddings unter einem Dach, mit klaren Compliance- und Security-Eigenschaften – was gerade für regulierte Branchen wie Finance, Legal oder Healthcare entscheidend ist.
Der RAG-Ansatz ist bemerkenswert pragmatisch umgesetzt: Statt proprietärer Indizierung setzt PwC auf OpenSearch Serverless als Vektordatenbank, kombiniert mit impliziter semantischer und expliziter Metadaten-Filterung. Das macht das System sowohl für explorative Anfragen als auch für streng eingegrenzte Compliance-Checks einsetzbar. Die Integration downstream via AWS Lambda, EventBridge und SQS in CLM-Systeme, ERPs oder Datenwarenhäuser ist ebenfalls vorgedacht.
Für CTOs und Architekten, die eigene Document-Intelligence-Projekte evaluieren, liefert dieser Beitrag eine konkrete Referenzarchitektur – mit klaren Aussagen zu Skalierung, Sicherheitsebenen und operativem Overhead.