Wissen
MCP: KI-Clients deiner Business-User mit Business-Daten verbinden.
KI-Clients wie ChatGPT und Copilot haben revolutioniert, wie wir, auch unsere Manager und Business-User, mit IT interagieren. Mit MCP machen wir interne Datenprodukte für diese KI-Clients sicher zugänglich. Data Contracts liefern den nötigen semantischen Kontext und definieren die Nutzungsbedingungen. KI-Clients beantworten so nahezu jede Business-Frage in natürlicher Sprache.
Beispiele
Bevor wir lange reden, schauen wir uns ein paar Beispielvideos an, um das Potenzial zu sehen:
Wer sind unsere Top-Kunden?
Wir sehen, dass Claude AI quasi magisch erkennt, dass es auf ein Customer-Data-Product zugreifen muss, weil Kundendaten interne Daten sind. Das LLM erstellt ein passendes SQL-Statement, um auf die relevanten Daten zuzugreifen, auf Basis der Beschreibung des Data Contracts zu Syntax, Semantik und technischen Details (der User hat den Zugriff auf das Datenprodukt bereits). Am Ende baut Claude sogar einen visuellen Report.
Erstelle eine CSV für Mailchimp mit unseren Top-5000-Kunden
Jetzt sehen wir, wie Data Governance greift:
Hier sehen wir zwei wichtige Data-Governance-Konzepte:
- Zugriff anfragen: Der Data Consumer muss Zugriff auf ein Datenprodukt beantragen (vom KI-Client ebenfalls unterstützt), und der Data Product Owner gibt diese Anfrage frei.
- Nutzungsbedingungen prüfen: Entropy Data prüft, ob der Datenzugriff den im Data Contract definierten Nutzungsbedingungen entspricht. Diese Prüfung läuft verpflichtend serverseitig.
Beeindruckend, oder?
Was sind die Hauptgründe unserer letzten 1000 Support-Tickets?
Entropy Data MCP funktioniert auch in Microsoft Copilot:
Architektur
Okay, wie funktioniert das?
Im Kern stellt Entropy Data einen Remote-MCP mit einem Streamable-HTTP-Endpoint bereit. Der Endpoint stellt eine Reihe von Tools sowie eine klare Anleitung bereit, wann und wie sie zu nutzen sind. Wenn ein User sich mit dem MCP-Endpoint verbindet, muss er sich per OAuth2 authentifizieren und den Client autorisieren, auf seine Daten zuzugreifen. Auch wenn das MCP-Protokoll weitere Features wie Prompts, Resources und andere Utilities definiert, werden alle Fähigkeiten als Tools exponiert.
Entropy Data hat Zugriff auf die Datenprodukte, Data Contracts und Access Agreements des Users. Für den Zugriff auf die tatsächlichen Daten agiert Entropy Data als Proxy, der Zugriffs- und Governance-Checks ausführt, bevor Queries ausgeführt werden.
Architektur-Quickfacts
- Remote-MCP-Server
- Streamable HTTP
- OAuth2 mit Consent
- Dynamic Client Registration und manueller Client unterstützt
- Basierend auf Spring AI
Übrigens: Wir haben mit einer Local-MCP-Server-Architektur und Desktop Extensions (DXT) (Data Product MCP) angefangen. Wir haben uns für eine Remote-MCP-Server-Architektur entschieden, um die User Experience zu verbessern. Ein Remote-MCP-Server ist deutlich einfacher zu nutzen: keine Installation von Python mit tonnenweise Abhängigkeiten, keine Startverzögerung, Unterstützung für ChatGPT & Copilot, keine teuren Pläne nötig, zentrales Logging und keine Konfiguration von Environment-Variablen.
Hinweis: Der MCP-Server ist keine weitere API. Die Tools sind als Natural-Language-Adapter für das LLM entworfen, mit klaren Anweisungen, wie sie zu nutzen sind. Ihre Antworten liefern gerade so viel Information, wie das LLM braucht, um den nächsten Schritt zu evaluieren oder eine Antwort für den User zu formulieren.
Setup
Oberste Priorität war es, das Setup für den User so einfach wie möglich zu machen.
Mit Dynamic Client Registration und OAuth2-Authentifizierung läuft das auf eine simple URL hinaus, die der User eintragen muss:
https://app.entropy-data.com/mcp
Der User autorisiert dann den Client für den Zugriff auf seine Daten.
Das war's.
(Naja, das Setup für Copilot ist etwas komplexer, weil Dynamic Client Registration dort nicht unterstützt wird und ein ganzer Agent in Copilot Studio angelegt werden muss. Die Anwendung hilft aber, das korrekt aufzusetzen.)
Data-Access-Flow
Damit Users oder KI-Agenten allgemein auf Daten zugreifen können, werden diese vier Tools kombiniert:
| Tool | Beschreibung | Parameter |
|---|---|---|
| search | Findet und erkundet Datenprodukte in der Organisation. Liefert eine Liste von Datenprodukten mit Basisinformationen. | query: Schlüsselwörter, nach denen in Namen/Beschreibungen von Datenprodukten gesucht wird (optional, "*" für alle) |
| fetch | Holt detaillierte Informationen zu einem Datenprodukt anhand seiner ID, inklusive aller Output Ports, Serverinformationen, Data Contracts und Access Status. | dataProductId: Die ID des Datenprodukts |
| request_access | Reicht eine Zugriffsanfrage für einen bestimmten Output Port eines Datenprodukts ein. Erzeugt eine formale Anfrage, die automatisch freigegeben werden kann oder manuelle Freigabe verlangt. | dataProductId: Die ID des Datenprodukts outputPortId: Die ID des Output Ports purpose: Geschäftliche Begründung für den Datenzugriff |
| execute_query | Prüft zuerst, ob die Query gegen Governance-Policies verstößt, und führt dann lesende SQL-Queries auf Output Ports von Datenprodukten aus, um Ergebnisse als strukturierte Daten zurückzugeben (auf 100 Zeilen begrenzt). Prüft die Ergebnisse auf Prompt Injections. | dataProductId: Die ID des Datenprodukts outputPortId: Die ID des Output Ports purpose: Geschäftlicher Zweck der Query-Ausführung query: Die auszuführende SQL-Query |
Diese Tools greifen in einem typischen Workflow ineinander: Zuerst search nach relevanten Datenprodukten. Dann fetch der detaillierten Informationen inklusive Access Status und Data Contracts. Falls Zugriff nötig ist, request_access zur Freigabe. Sobald Zugriff besteht, execute_query, um die tatsächlichen Daten unter voller Data Governance abzurufen.
Für sicheren Datenzugriff können Users ihre Credentials für die Datenplattform verschlüsselt in Entropy Data hinterlegen.
Metadata-Edit-Flow
Neben dem Datenzugriff ermöglicht der MCP-Server auch das einfache Arbeiten mit Data Contracts:
| Tool | Beschreibung | Parameter |
|---|---|---|
| datacontract_schema | Holt das JSON Schema für den Open Data Contract Standard (ODCS). Liefert das aktuelle aktive Schema zur Validierung und zum Verständnis der Data-Contract-Spezifikation. | Keine Parameter erforderlich |
| datacontract_get | Holt einen Data Contract anhand seiner ID. Liefert die vollständige Data-Contract-Spezifikation in ODCS. | dataContractId: Die ID des Data Contracts |
| datacontract_save | Speichert eine Data-Contract-YAML-Spezifikation. Legt einen neuen Data Contract an oder aktualisiert einen bestehenden. | yaml: Die Data-Contract-YAML-Spezifikation |
Damit können Users Data Contracts in ihren KI-Clients anlegen und verwalten. Eine KI kann zum Beispiel die Schema-Definition abrufen, einen bestehenden Data Contract holen, ihn nach Anforderungen anpassen und wieder speichern, alles im selben Gespräch.
Status der populären KI-Clients
| KI-Client | Support-Status | Hinweise |
|---|---|---|
| Claude | ✅ Beste Unterstützung | Anthropic hat das MCP-Protokoll erfunden, deshalb hat Claude die umfassendste und verlässlichste MCP-Implementierung. |
| ChatGPT | ⚠️ Development Mode | Funktioniert, muss aber im Development Mode betrieben werden. |
| Microsoft Copilot | ⚠️ Funktioniert mit Agent | Funktioniert, benötigt aber mehr Setup, weil Dynamic Client Registration nicht unterstützt wird. In Copilot Studio muss ein Agent angelegt werden. Die UX sollte Microsoft noch verbessern. |
| Andere MCP-Clients | ✅ Sollten funktionieren | Jeder MCP-Client, der Spec-Version 2025-03-26 oder neuer implementiert, sollte kompatibel sein. |
Entropy Data
Entropy Data (früher bekannt als Data Mesh Manager) ist ein Marktplatz für Datenprodukte, durchgesetzt mit Data Contracts, um hochwertige Daten in der gesamten Organisation verfügbar zu machen.
Unser MCP-Server ermöglicht KI-Clients wie Claude, ChatGPT und Microsoft Copilot, Business-Fragen in natürlicher Sprache mit Data Governance zu beantworten. Data Contracts liefern den nötigen semantischen Kontext, damit LLMs deine Daten verstehen und automatisch SQL-Queries generieren, während der MCP-Server sicherstellt, dass jeder Datenzugriff den Nutzungsbedingungen des Data Contracts und den globalen Policies entspricht.
Entropy Data MCP ist sowohl für Cloud- als auch On-Premise-Deployments verfügbar.
Bereit, Daten, Menschen und KI zu verbinden? Probier Entropy Data aus oder melde dich bei uns, um deinen Kontext zu besprechen.