Forschung
Forschung
Bei Entropy Data engagieren wir uns dafür, das Feld der Data Governance durch Forschung und Innovation voranzubringen.
Data Governance mit Generative AI automatisieren
Diese Forschungsarbeit untersucht, wie Large Language Models Data Governance unterstützen können, indem sie Warnhinweise zu Entscheidungen über Datenzugriffe in dezentralen Systemen generieren. Die Studie führt Governance AI ein, ein LLM-gestütztes Tool, das prüft, ob Zugriffsanfragen Data Contracts, Unternehmensrichtlinien und Regularien wie der DSGVO entsprechen.
Statt finale Entscheidungen zu treffen, liefert das System „strukturierte Warnungen und Korrekturvorschläge, die menschliche Experts anleiten."
Dieser Ansatz stellt sicher, dass KI menschliche Entscheidungen unterstützt, statt sie zu ersetzen, sodass die nötige menschliche Aufsicht für kontextuelle und rechtliche Korrektheit in Governance-Entscheidungen erhalten bleibt.
Publikationsdetails
Autoren:
- Linus W. Dietz (King's College London)
- Arif Wider (HTW Berlin)
- Simon Harrer (Entropy Data)
Konferenz: AAAI/ACM Conference on Artificial Intelligence, Ethics, and Society 2025
Zentrale Ergebnisse
- Governance AI gab 3,6-mal mehr Warnungen als menschliche Experts aus und erkannte dabei alle Compliance-Risiken
- 80 % der KI-generierten Warnungen wurden nach Sekundärprüfung als korrekt bewertet
- LLM-generierte synthetische Testfälle bilden reale Governance-Szenarien effektiv ab
- Menschliche Aufsicht bleibt essenziell für kontextuelle und rechtliche Korrektheit
Mehr erfahren
Data Product MCP: Mit deinen Enterprise-Daten chatten
Diese Forschungsarbeit stellt einen Model-Context-Protocol-(MCP-)Server vor, der konversationelle Interaktion mit Enterprise-Data-Products ermöglicht. Die Lösung adressiert die Herausforderung, vielfältige Datenquellen in LLM-Workflows zu integrieren, bei gleichzeitiger Wahrung der Data-Governance-Standards.
Das Framework bietet Organisationen einen praktischen Weg, LLMs in Datenexploration und -analyse zu nutzen, ohne Datenschutzstandards zu kompromittieren.
Indem Enterprise-Data-Products und KI-Systeme über eine standardisierte Schnittstelle verbunden werden, können Organisationen den Datenzugang demokratisieren und gleichzeitig Sicherheits- und Governance-Kontrollen aufrechterhalten.
Publikationsdetails
Autoren:
- Marco Tonnarelli
- Filippo Scaramuzza
- Simon Harrer (Entropy Data)
- Linus W. Dietz (King's College London)
Status: Angenommen zur Veröffentlichung in den Springer Communications in Computer and Information Science (CCIS) Proceedings der SummerSoC-Konferenz (arXiv Preprint, Mai 2026)
Zentrale Beiträge
- MCP-Server-Implementierung, die Enterprise-Data-Products und KI-Systeme verbindet und Natural-Language-Queries gegen strukturierte Datensätze ermöglicht
- Governance-bewusstes Design, das die Einhaltung der Data-Governance-Anforderungen im Unternehmen sichert
- Datenprodukt-Integration, die bestehende Standards nutzt, um eine standardisierte Schnittstelle für LLM-Zugriff zu schaffen
- Offene Architektur, erweiterbar, sodass Organisationen sie an ihre spezifischen Dateninfrastrukturen anpassen können
Mehr erfahren
Data Contracts: Versprechen und Erwartungen im Datenaustausch strukturieren
Diese Forschungsarbeit schlägt ein allgemeines Konzept von Data Contracts vor, das die Perspektiven von Data Providers und Data Consumers gleichermaßen erfasst. Die meisten Interpretationen behandeln Data Contracts als einseitige, provider-getriebene Artefakte – robuster Datenaustausch erfordert jedoch Erwartungen und Versprechen von beiden Seiten. Das Paper strukturiert einen Data Contract in vier eigenständige Aspekte: Versprechen der Provider, Erwartungen der Consumer, Erwartungen der Provider und Versprechen der Consumer.
Wir schlagen vor, Provider-Erwartungen und consumer-getriebene Contracts explizit umzusetzen und Data Contracts so vollständig aus beiden Perspektiven zu definieren, sodass Consumers Vereinbarungen explizit beeinflussen können.
Indem alle vier Aspekte explizit gemacht werden, ermöglicht der Ansatz ein höheres Maß an Data-Governance-Automatisierung – etwa das automatische Matching von Consumers mit Datenprodukten, die ihre Anforderungen erfüllen – und reduziert das Risiko von Datenvorfällen, die entstehen, wenn Erwartungen und Versprechen implizit bleiben.
Publikationsdetails
Autoren:
- Laura Schuiki (University of Stuttgart)
- Arif Wider (HTW Berlin)
- Simon Harrer (Entropy Data)
Status: Angenommen zur Veröffentlichung in den IEEE-Proceedings der International Conference on Web Services (ICWS) 2026
Zentrale Beiträge
- Ein allgemeines Konzept von Data Contracts, das vier Aspekte umfasst: Versprechen der Provider, Erwartungen der Consumer, Erwartungen der Provider und Versprechen der Consumer
- Consumer-getriebene Perspektive, die Consumers ermöglicht, Erwartungen zu äußern und Versprechen zu geben, statt nur Provider-Zusagen zu empfangen
- Höhere Governance-Automatisierung durch formalisierte Aspekte, die das automatische Matching von Datenprodukten zu Consumers ermöglichen
- Standards-Analyse, wie ODCS und ODPS das Konzept unterstützen, validiert durch Experteninterviews in drei Unternehmen
Mehr erfahren
Auswirkungen auf unsere Produkte
Die Erkenntnisse aus dieser Forschung fließen in die Entwicklung unserer Produkte ein, einschließlich der KI-gestützten Governance-Funktionen in Entropy Data. Indem wir erkunden, wie KI menschliche Entscheidungen in der Data Governance unterstützen und verbessern kann, machen wir Daten in Organisationen zugänglicher, sicherer und konformer.