Talk
Data Contracts: What They Are, Why They Matter, and How to Use Them
Jochen Christ, Co-Founder & CTO @ Entropy Data · 12. März 2026
In diesem Vortrag beim TDWI Roundtable Münster erkläre ich, was Data Contracts sind, wie sie sich mit API-Spezifikationen in der Softwarewelt vergleichen lassen und warum sie für das Management von Daten über Teams hinweg unverzichtbar geworden sind. Wir gehen ein konkretes Beispiel mit dem Open Data Contract Standard (ODCS) durch, diskutieren Contract-First- vs. Data-First-Ansätze, erkunden Tools wie die Data Contract CLI und den Data Contract Editor und schauen uns an, wie Data Contracts zur Governance-Ebene für KI-Agenten werden, die auf Unternehmensdaten zugreifen.
Hinweis: Der Vortrag wurde auf Deutsch gehalten. Das Transkript unten basiert auf der Originalaufnahme. Transkribiert und zusammengefasst mit KI.
Danke an TDWI für die Ausrichtung des Roundtable Münster und an Bodo Hüsemann für die Gastgeberrolle bei x1F.
Q&A
Ausgewählte Fragen aus dem Publikum während des Vortrags.
F: Kann ich denselben Datensatz in verschiedenen Granularitäten verwenden —z. B. aggregiert vs. roh? Wie gehe ich mit Varianten um?
Konzeptionell sind das unterschiedliche Data Contracts. Jede Variante —andere Granularität, anderes Format —bekommt ihren eigenen Contract. Du kannst sie verlinken oder als verwandt taggen, aber logisch sind es separate Schnittstellen mit separaten Garantien.
F: Kann ich Data Contracts für den operativen Datenaustausch zwischen Microservices nutzen, nicht nur für analytische Daten?
Ja, definiere die nicht-funktionalen Garantien —Verfügbarkeit, Latenz, Support-Zeiten —im Contract. Dann kann der Consumer entscheiden, ob diese Garantien für seinen operativen Use Case ausreichen. Ein Webshop würde niemals von einem System mit 99,8% Verfügbarkeit abhängen, ohne einen Anti-Corruption-Layer oder eine asynchrone Entkopplung hinzuzufügen.
F: Wie formalisiert ihr Nutzungsbedingungen für KI-Agenten? Natürliche Sprache scheint für eine automatisierte Durchsetzung zu vage.
Unser Ansatz ist, die Nutzungsbedingungen in natürlicher Sprache zu halten und einen spezialisierten Agenten sie gegen die Query und den Prompt interpretieren zu lassen. Ein KI-System kann bewerten, ob „diese Daten dürfen nicht für Marketingzwecke genutzt werden" auf eine gegebene Query zutrifft. Die Governance-Ebene —die MCP-Server-Implementierung —setzt globale Policies, Quotas und Sicherheits-Checks durch, bevor SQL zur Datenplattform durchgelassen wird.
F: Wie oft stellst du beim Definieren von Qualitätsanforderungen fest, dass du zusätzliche Informationen im Schema erfassen musst?
Ziemlich oft. Wenn du Datenmodelle mit Domänenexperten diskutierst, kommen Dinge zum Vorschein, die verborgen waren. Klassisches Beispiel: Statusfelder, bei denen du dachtest, es gäbe nur drei oder vier Zustände, aber plötzlich gibt es einen „teilweise geliefert"-Zustand oder Fehlerzustände, die all deine Annahmen über den Haufen werfen. Statusfelder und Consent-Filter sind besonders heikel. Genau deshalb ist der Workshop-Prozess so wertvoll —er erzwingt diese Entdeckungen.