Talk
Let's Talk About Data Contracts: Standards, Tooling & Best Practices
Dr. Simon Harrer, Co-Founder & CEO @ Entropy Data · 19. März 2026
In diesem Vortrag beim INFOMOTION Data & AI Meetup Cologne erkläre ich alles, was du über Data Contracts wissen musst: was sie sind, warum sie wichtig sind, den Open Data Contract Standard (ODCS), Open-Source-Tooling, Best Practices für Versionierung und Lifecycle-Management und warum agentische KI Data Contracts so allgegenwärtig machen wird wie OpenAPI.
Danke an Prof. Dr. Ana Moya, Peter Baumann und INFOMOTION für die Organisation des Meetups und die Einladung zum Vortrag, und an Jochen Christ dafür, den Vortrag mitgestaltet zu haben.
Q&A
Ausgewählte Fragen aus dem Publikum nach dem Vortrag.
F: Wie holen wir die Business-Seite ins Boot? Das fühlt sich alles noch sehr technisch an. Selbst deine Agenten-Demo hat Kunden-IDs zurückgegeben, keine Namen wie "Zalando" oder "H&M".
Zwei Antworten. Erstens: Der Grund, warum die Demo kryptisch aussah, war, dass der Agent nur Zugriff auf die IDs hatte -- er hatte keine Berechtigung, sie zu Klartextnamen aufzulösen. Mit den richtigen Berechtigungen würde er das tun. Zweitens: Die Data Contracts sind gezielt darauf ausgelegt, Business-Sprache zu transportieren. Wir haben Business-Namen für alle Spalten und Tabellen. Du kannst ein Data Dictionary oder Glossar definieren -- etwa "das bedeutet eine Bestellnummer" -- einmal, und alle Contracts referenzieren diese Definition. Außerdem kannst du jetzt Beispielfragen, Antworten, Synonyme und ergänzendes Wissen an einen Contract anhängen, damit die KI noch besser antworten kann. Das ist alles für Business-User optimiert.
F: Ich komme aus der Produktion/Fertigung. Kann ich Beziehungen zwischen Datenpunkten modellieren -- etwa den Durchfluss durch ein Rohr, wohin er geht und wie viel ankommen soll?
Nicht direkt, weil Contracts auf Schema-Ebene arbeiten, nicht auf Instanz-Ebene. Wir betrachten, welche Spalten existieren, und treffen Aussagen über Spalten, aber nicht über einzelne Zeilen. Wenn jeder Datenpunkt im Grunde seine eigene Tabelle ist, kommst du in den Bereich von Digital Twin und Asset Administration Shell, und das ist eine andere Welt. Du könntest theoretisch für jede Tabelle einen Contract anlegen, aber du musst aufpassen, dass der Contract am Ende nicht größer wird als die Daten selbst.