Open Source

🚀 Data Contract CLI v1.0 veröffentlicht

Das Data Contract CLI hat sich zum Standard-Open-Source-Tool zum Testen, Linten, Importieren und Exportieren von Data Contracts entwickelt — mit nativem Support für den Open Data Contract Standard (ODCS). Nach einem langen Weg vieler Releases haben wir jetzt die erste Major-Version veröffentlicht: ein großer Schritt hin zu einem schlankeren, schnelleren und produktionsreiferen Tool für bessere Datenqualität.

Data Contract CLI führt Datenqualitätstests im Terminal aus

Was ist neu in v1.0

  • 📦 Weniger Abhängigkeiten. Wir haben viele Abhängigkeiten entfernt, native Datenqualitätschecks implementiert und das Ibis-Framework als schlanke Datenbank-Abstraktionsschicht eingeführt. Leichtere Installation, schnelleres Setup, weniger CVEs.
  • 🐍 Support für Python 3.13 und 3.14. Das CLI läuft jetzt auf den neuesten Python-Releases, inklusive PySpark-4.0-Support.
  • 🧱 Besserer Databricks-Support. Databricks funktioniert jetzt mit OAuth Service Principals, lokalen Config-Profilen und der einheitlichen Databricks-SDK-Authentifizierung, nicht nur mit Personal Access Tokens. Dazu besserer Support für neuere Databricks-Compute-Instanzen mit PySpark 4.0.
  • 🔍 Neue Option --include-failed-samples. Sammle Samples der Zeilen, die einen Qualitätscheck nicht bestanden haben, um schneller zu debuggen — sensible Spalten werden anhand deiner Klassifizierungen automatisch ausgeschlossen.
  • 🔒 Gehärtetes Docker-Image. Minimierte CVEs, Non-Root-User, SBOM-Signaturen und voller Spark-Support out of the box.

Ein riesiges Dankeschön an unsere Community aus Contributors und Usern und an alle, die Issues gemeldet und frühe Builds getestet haben. Ein besonderer Dank geht an Bitol und die Open Data Contract Standard Community für die laufende Zusammenarbeit, die interoperable Data Contracts Realität werden lässt.

Probier es aus

Installiere das CLI, starte deinen ersten datacontract test und sag uns, was du denkst.