Talk · 2026
Data-first or Contract-first?
Jochen Christ (CTO & Co-Founder, Entropy Data) · 11. Juni 2026
Wenn du ein Datenprodukt baust, wo fängst du an? Jochen geht zwei Wege zum selben Ziel ab. Der traditionelle Data-first-Weg zieht Produktionsdaten, exploriert sie und shippt, was da ist. Der Contract-first-Weg beginnt mit einem Gespräch, schreibt den Contract, bevor die Daten existieren, und lässt einen Coding-Agenten das Produkt daraus bauen. Mit dabei: Data Contracts, der Open Data Contract Standard, die Data Contract CLI und ein Live-Build desselben Shelf-Warmers-Produkts, der etwa zehn Minuten dauert.
Annotierte Folien-Notizen aus Jochen Christs Konferenz-Talk. Der Text unten ist eine redigierte Zusammenfassung.
Q&A
Ausgewählte Fragen aus dem Publikum nach dem Talk.
F: Wenn der Agent die dbt-Modelle generiert, wer pflegt sie danach? Editiere ich den dbt-Code, oder gehe ich zurück zum Contract und generiere neu?
Das hängt von deiner Kultur und der Reife deiner Engineering-Organisation ab, aber persönlich würde ich nicht mehr zu viel in den dbt-Code schauen. Ich würde die Anforderungen im Contract ändern, und wenn das Ergebnis nicht stimmt, die Skills verbessern. Bau eine Feedback-Schleife in dein Skill-Repository ein und optimiere von dort, statt generierten Code von Hand zu patchen.
F: Unterscheidet ihr einen Marktplatz von einem Datenkatalog, oder behandelt ihr sie als dasselbe?
Wir unterscheiden sie. Ein Katalog ist ein technischer Index jedes existierenden Datensatzes, oft Millionen von Assets. Ein Marktplatz enthält nur Datenprodukte, die zum Teilen und Konsumieren durch andere Teams gedacht sind, meist ein paar Hundert. Der Marktplatz ist, wo die kontextuelle Information auf Contract-Ebene lebt.
F: Data-first fördert oft Erkenntnisse zutage, nach denen niemand gefragt hat. Heißt immer Contract-first nicht, dass du nur beantwortest, was Leute schon zu fragen wissen?
Ein fairer Punkt, und du willst explorative Fähigkeiten behalten. Der Schlüssel ist die Grenze: innerhalb deiner eigenen Domäne, wo du schon verstehst, was die Daten bedeuten, behalte einfachen explorativen, data-first Zugriff. Data Contracts zählen, wenn du eine Organisationsgrenze überschreitest, denn dort beginnt ein neuer Bounded Context, und geteilte Daten brauchen ein vereinbartes, dokumentiertes Interface.
F: Sollte der Contract das physische Schema vorab spezifizieren, oder nur Zweck und konzeptionelles Modell, und den Agenten das physische Schema herausfinden lassen?
Im Contract würde ich das konzeptionelle und logische Modell definieren und die physische, technische Implementierung dem Skill oder der Ziel-Datenplattform überlassen. Das Business-Wissen geht ins Modell; das plattformspezifische Detail geht in die Skills.
F: Wir sehen Data Contracts an den Rändern des Datenflusses, an den Quellen und vor dem Konsum. Siehst du sie auch in der Mitte, auf jedem Schritt der Lineage?
Meine Sicht ist, dass ein Data Contract eine neue Vertrauensgrenze bildet. Du brauchst wahrscheinlich keinen Contract auf jedem Sprung zurück bis zur allerersten Quelle; du brauchst Lineage zurück bis zum letzten Data Contract, auf den du dich verlässt. Zwischen Contracts kannst du technische Lineage nutzen, also die interne Verdrahtung der Pipeline eines Datenprodukts. Vertrauen wird am Quell-Contract verankert.