In diesem Dokument wird beschrieben, wie Sie den Remote-MCP-Server (Model Context Protocol) für die Datenherkunft verwenden, um eine Verbindung zu KI-Anwendungen wie Gemini CLI, ChatGPT, Claude und benutzerdefinierten Anwendungen herzustellen, die Sie entwickeln. Mit dem Remote-MCP-Server für die Datenherkunft können Sie mit der Datenherkunft interagieren, um Datenherkunftsgrafiken abzufragen, die vorgelagerte Datenherkunft zu ermitteln und die nachgelagerte Auswirkung zu analysieren. Der Remote-MCP-Server der Data Lineage API wird aktiviert, wenn Sie die Data Lineage API aktivieren.
Das Model Context Protocol (MCP) standardisiert, wie Large Language Models (LLMs) und KI-Anwendungen oder ‑Agents eine Verbindung zu externen Datenquellen herstellen. Mit MCP-Servern können Sie ihre Tools, Ressourcen und Prompts verwenden, um Aktionen auszuführen und aktualisierte Daten von ihrem Backend-Dienst abzurufen.
Was ist der Unterschied zwischen lokalen und Remote-MCP-Servern?
- Lokale MCP-Server
- werden in der Regel auf Ihrem lokalen Computer ausgeführt und verwenden die Standardeingabe- und ‑ausgabestreams (stdio) für die Kommunikation zwischen Diensten auf demselben Gerät.
- Remote-MCP-Server
- werden in der Infrastruktur des Dienstes ausgeführt und bieten einen HTTP-Endpunkt für KI-Anwendungen zur Kommunikation zwischen dem KI-MCP-Client und dem MCP-Server. Weitere Informationen zur MCP-Architektur finden Sie unter MCP-Architektur.
Google- und Google Cloud Remote-MCP-Server
Google- und Google Cloud Remote-MCP-Server bieten die folgenden Funktionen und Vorteile:- Vereinfachte, zentrale Erkennung
- Verwaltete globale oder regionale HTTP-Endpunkte
- Detaillierte Autorisierung
- Optionale Prompt- und Antwortsicherheit mit Model Armor-Schutz
- Zentralisierte Audit-Protokollierung
Informationen zu anderen MCP-Servern und zu Sicherheits und Governance-Kontrollen, die für Google Cloud-MCP-Server verfügbar sind, finden Sie unter Übersicht über Google Cloud-MCP-Server.
Hinweis
- Melden Sie sich in Ihrem Google Cloud Konto an. Wenn Sie noch kein Konto haben Google Cloud, erstellen Sie ein Konto, um die Leistung unserer Produkte in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the Data Lineage API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the Data Lineage API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.
Erforderliche Rollen
Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen für das Projekt zuzuweisen, in dem Sie den MCP-Server für die Datenherkunft verwenden möchten, um die Berechtigungen zu erhalten, die Sie zur Verwendung des MCP-Servers für die Datenherkunft benötigen:
-
MCP-Tool-Aufrufe ausführen:
MCP Tool User (
roles/mcp.toolUser) -
Informationen zur Datenherkunft ansehen:
Data Lineage-Betrachter (
roles/datalineage.viewer)
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Diese vordefinierten Rollen enthalten die Berechtigungen, die zur Verwendung des MCP-Servers für die Datenherkunft erforderlich sind. Maximieren Sie den Abschnitt Erforderliche Berechtigungen , um die notwendigen Berechtigungen anzuzeigen, die erforderlich sind:
Erforderliche Berechtigungen
Die folgenden Berechtigungen sind erforderlich, um den MCP-Server für die Datenherkunft zu verwenden:
-
MCP-Tool-Aufrufe ausführen:
mcp.tools.call -
Datenherkunft nach Links abfragen:
datalineage.locations.searchLinks
Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.
Authentifizierung und Autorisierung
Der Remote-MCP-Server der Data Lineage API verwendet das OAuth 2.0 Protokoll mit Identity and Access Management (IAM) zur Authentifizierung und Autorisierung. Alle Google Cloud Identitäten werden für die Authentifizierung bei MCP-Servern unterstützt.Wir empfehlen, eine separate Identität für Agents zu erstellen, die MCP-Tools verwenden, damit der Zugriff auf Ressourcen gesteuert und überwacht werden kann. Weitere Informationen zur Authentifizierung finden Sie unter Bei MCP-Servern authentifizieren.
OAuth-Bereiche für den MCP-Server für die Datenherkunft
OAuth 2.0 verwendet Bereiche und Anmeldedaten, um zu ermitteln, ob ein authentifizierter Prinzipal berechtigt ist, eine bestimmte Aktion für eine Ressource auszuführen. Weitere Informationen zu OAuth 2.0-Bereichen bei Google finden Sie unter Mit OAuth 2.0 auf Google APIs zugreifen.
Die Datenherkunft hat die folgenden OAuth-Bereiche für MCP-Tools:
| Bereichs-URI für die gcloud CLI | Beschreibung |
|---|---|
https://www.googleapis.com/auth/datalineage.readonly |
Ermöglicht nur den Lesezugriff auf Daten. |
https://www.googleapis.com/auth/datalineage.read-write |
Ermöglicht den Lese- und Änderungszugriff auf Daten. |
Für die Ressourcen, auf die während eines Tool-Aufrufs zugegriffen wird, sind möglicherweise zusätzliche Bereiche erforderlich. Eine Liste der für die Datenherkunft erforderlichen Bereiche finden Sie unter Data Lineage API.
MCP-Client für die Verwendung des MCP-Servers für die Datenherkunft konfigurieren
KI-Anwendungen und ‑Agents wie Claude oder Antigravity können einen MCP-Client instanziieren, der eine Verbindung zu einem einzelnen MCP-Server herstellt. Eine KI-Anwendung kann mehrere Clients haben, die eine Verbindung zu verschiedenen MCP-Servern herstellen. Wenn Ihre Anwendung nicht in der clientspezifischen Anleitung aufgeführt ist, können Sie die folgenden Informationen verwenden, um eine Verbindung von den meisten Anwendungen aus herzustellen.
Suchen Sie in Ihrer KI-Anwendung nach einer Möglichkeit, einen Remote-MCP-Server hinzuzufügen oder eine Verbindung zu ihm herzustellen. Geben Sie für den MCP-Server für die Datenherkunft die folgenden Informationen ein:
- Servername: MCP-Server für die Datenherkunft
- Server-URL oder Endpunkt:
- Globaler Endpunkt:
https://datalineage.googleapis.com/mcp - Regionale Endpunkte:
https://REGION-datalineage.googleapis.com/mcp. Ersetzen Sie REGION durch eine der unterstützten Regionen.
- Globaler Endpunkt:
- Transport: HTTP
- Authentifizierungsdetails: Je nachdem, wie Sie sich authentifizieren möchten, können Sie Ihre Anmeldedaten, Ihre OAuth-Client-ID und Ihren Clientschlüssel oder eine Agent-Identität und ‑Anmeldedaten eingeben. Google Cloud Weitere Informationen zur Authentifizierung finden Sie unter Bei MCP-Servern authentifizieren.
- OAuth-Bereich: der OAuth 2.0-Bereich, den Sie verwenden möchten, wenn Sie eine Verbindung zum MCP-Server für die Datenherkunft herstellen.
Anwendungsspezifische Anleitungen zum Einrichten und Herstellen einer Verbindung zu einem MCP-Server finden Sie unter Clientspezifische Anleitung.
Allgemeinere Anleitungen finden Sie in den folgenden Ressourcen:
Verfügbare Tools
Details zu verfügbaren MCP-Tools und deren Beschreibungen für den MCP-Server für die Datenherkunft finden Sie in der MCP-Referenz für die Datenherkunft.
Tools auflisten
Verwenden Sie den MCP-Inspector, um Tools aufzulisten, oder senden Sie eine
tools/list HTTP-Anfrage direkt an den Remote-MCP-Server für die Datenherkunft. Für die Methode tools/list ist keine Authentifizierung erforderlich.
POST /mcp HTTP/1.1
Host: datalineage.googleapis.com
Content-Type: application/json
{
"method": "tools/list",
"jsonrpc": "2.0",
"id": 1
}
Beispielanwendungsfälle
Beispielanwendungsfälle für den MCP-Server für die Datenherkunft:
- Alle vorgelagerten Datenquellen und Transformationsprozesse ermitteln, die in ein bestimmtes Daten-Asset einfließen, um Datenherkunft und ‑genauigkeit zu überprüfen.
- Auswirkungen von fehlerhaften, angehaltenen oder verzögerten Datenpipelines auf nachgelagerte Datenverbraucher analysieren.
Beispiel-Prompts
- „In meinem Projekt
my-analytics-projecthabe ich ein Datasetsales_datamit einer Tabelle namensmonthly_reports. Nennen Sie mir alle Daten-Assets und Transformationsprozesse, die Daten in diese Tabelle einfließen lassen.“ - „Ich habe einen BigQuery-Job, der in die Tabelle
hr_dataset.salaryschreibt. Ich sehe, dass der Job seit 12 Stunden nicht ausgeführt wird. Können Sie mir sagen, welche nachgelagerten Assets aufgrund dieses Problems veraltete Daten enthalten?“ - „Sehen Sie sich die Tabelle
monthly_reportsim Datasetsales_dataund im Projektmy-analytics-projectan, um alle Spalten mit vorgelagerten Datenquellen zu finden. Nennen Sie mir alle Prozesse, die in diese Spalten einfließen.“ - „Suchen Sie nach Herkunftslinks, die mit der Tabelle
finance.employment_costsverknüpft sind, um die vorgelagerten Abhängigkeiten zu ermitteln.“
Optionale Sicherheitskonfigurationen
MCP birgt neue Sicherheitsrisiken und ‑aspekte, da Sie mit den MCP-Tools eine Vielzahl von Aktionen ausführen können. Um diese Risiken zu minimieren und zu verwalten, Google Cloud bietet Standardeinstellungen und anpassbare Richtlinien, mit denen die Verwendung von MCP-Tools in Ihrer Google Cloud Organisation oder Ihrem Projekt gesteuert werden kann.
Weitere Informationen zu MCP-Sicherheit und ‑Governance finden Sie unter KI-Sicherheit und ‑Sicherheitsvorkehrungen.
MCP-Nutzung mit IAM-Ablehnungsrichtlinien steuern
Mit IAM-Ablehnungsrichtlinien (Identity and Access Management) können Sie Remote-MCP-Server schützen. Google Cloud Konfigurieren Sie diese Richtlinien, um den unerwünschten Zugriff auf MCP-Tools zu blockieren.
Sie können den Zugriff beispielsweise anhand der folgenden Kriterien ablehnen oder zulassen:
- Prinzipal
- Tool-Attribute wie „Schreibgeschützt“
- OAuth-Client-ID der Anwendung
Weitere Informationen finden Sie unter MCP-Nutzung mit IAM steuern.
Nächste Schritte
- Lesen Sie die Referenzdokumentation zum MCP für die Datenherkunft.
- Weitere Informationen zu Google Cloud-MCP-Servern