Remote-MCP-Server für Datenherkunft verwenden

In diesem Dokument wird beschrieben, wie Sie den Remote-MCP-Server (Model Context Protocol) für die Datenherkunft verwenden, um eine Verbindung zu KI-Anwendungen wie Gemini CLI, ChatGPT, Claude und benutzerdefinierten Anwendungen herzustellen, die Sie entwickeln. Mit dem Remote-MCP-Server für die Datenherkunft können Sie mit der Datenherkunft interagieren, um Datenherkunftsgrafiken abzufragen, die vorgelagerte Datenherkunft zu ermitteln und die nachgelagerte Auswirkung zu analysieren. Der Remote-MCP-Server der Data Lineage API wird aktiviert, wenn Sie die Data Lineage API aktivieren.

Das Model Context Protocol (MCP) standardisiert, wie Large Language Models (LLMs) und KI-Anwendungen oder ‑Agents eine Verbindung zu externen Datenquellen herstellen. Mit MCP-Servern können Sie ihre Tools, Ressourcen und Prompts verwenden, um Aktionen auszuführen und aktualisierte Daten von ihrem Backend-Dienst abzurufen.

Was ist der Unterschied zwischen lokalen und Remote-MCP-Servern?

Lokale MCP-Server
werden in der Regel auf Ihrem lokalen Computer ausgeführt und verwenden die Standardeingabe- und ‑ausgabestreams (stdio) für die Kommunikation zwischen Diensten auf demselben Gerät.
Remote-MCP-Server
werden in der Infrastruktur des Dienstes ausgeführt und bieten einen HTTP-Endpunkt für KI-Anwendungen zur Kommunikation zwischen dem KI-MCP-Client und dem MCP-Server. Weitere Informationen zur MCP-Architektur finden Sie unter MCP-Architektur.

Google- und Google Cloud Remote-MCP-Server

Google- und Google Cloud Remote-MCP-Server bieten die folgenden Funktionen und Vorteile:

  • Vereinfachte, zentrale Erkennung
  • Verwaltete globale oder regionale HTTP-Endpunkte
  • Detaillierte Autorisierung
  • Optionale Prompt- und Antwortsicherheit mit Model Armor-Schutz
  • Zentralisierte Audit-Protokollierung

Informationen zu anderen MCP-Servern und zu Sicherheits und Governance-Kontrollen, die für Google Cloud-MCP-Server verfügbar sind, finden Sie unter Übersicht über Google Cloud-MCP-Server.

Hinweis

  1. Melden Sie sich in Ihrem Google Cloud Konto an. Wenn Sie noch kein Konto haben Google Cloud, erstellen Sie ein Konto, um die Leistung unserer Produkte in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the Data Lineage API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  6. Verify that billing is enabled for your Google Cloud project.

  7. Enable the Data Lineage API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

Erforderliche Rollen

Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen für das Projekt zuzuweisen, in dem Sie den MCP-Server für die Datenherkunft verwenden möchten, um die Berechtigungen zu erhalten, die Sie zur Verwendung des MCP-Servers für die Datenherkunft benötigen:

Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

Diese vordefinierten Rollen enthalten die Berechtigungen, die zur Verwendung des MCP-Servers für die Datenherkunft erforderlich sind. Maximieren Sie den Abschnitt Erforderliche Berechtigungen , um die notwendigen Berechtigungen anzuzeigen, die erforderlich sind:

Erforderliche Berechtigungen

Die folgenden Berechtigungen sind erforderlich, um den MCP-Server für die Datenherkunft zu verwenden:

  • MCP-Tool-Aufrufe ausführen: mcp.tools.call
  • Datenherkunft nach Links abfragen: datalineage.locations.searchLinks

Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.

Authentifizierung und Autorisierung

Der Remote-MCP-Server der Data Lineage API verwendet das OAuth 2.0 Protokoll mit Identity and Access Management (IAM) zur Authentifizierung und Autorisierung. Alle Google Cloud Identitäten werden für die Authentifizierung bei MCP-Servern unterstützt.

Wir empfehlen, eine separate Identität für Agents zu erstellen, die MCP-Tools verwenden, damit der Zugriff auf Ressourcen gesteuert und überwacht werden kann. Weitere Informationen zur Authentifizierung finden Sie unter Bei MCP-Servern authentifizieren.

OAuth-Bereiche für den MCP-Server für die Datenherkunft

OAuth 2.0 verwendet Bereiche und Anmeldedaten, um zu ermitteln, ob ein authentifizierter Prinzipal berechtigt ist, eine bestimmte Aktion für eine Ressource auszuführen. Weitere Informationen zu OAuth 2.0-Bereichen bei Google finden Sie unter Mit OAuth 2.0 auf Google APIs zugreifen.

Die Datenherkunft hat die folgenden OAuth-Bereiche für MCP-Tools:

Bereichs-URI für die gcloud CLI Beschreibung
https://www.googleapis.com/auth/datalineage.readonly Ermöglicht nur den Lesezugriff auf Daten.
https://www.googleapis.com/auth/datalineage.read-write Ermöglicht den Lese- und Änderungszugriff auf Daten.

Für die Ressourcen, auf die während eines Tool-Aufrufs zugegriffen wird, sind möglicherweise zusätzliche Bereiche erforderlich. Eine Liste der für die Datenherkunft erforderlichen Bereiche finden Sie unter Data Lineage API.

MCP-Client für die Verwendung des MCP-Servers für die Datenherkunft konfigurieren

KI-Anwendungen und ‑Agents wie Claude oder Antigravity können einen MCP-Client instanziieren, der eine Verbindung zu einem einzelnen MCP-Server herstellt. Eine KI-Anwendung kann mehrere Clients haben, die eine Verbindung zu verschiedenen MCP-Servern herstellen. Wenn Ihre Anwendung nicht in der clientspezifischen Anleitung aufgeführt ist, können Sie die folgenden Informationen verwenden, um eine Verbindung von den meisten Anwendungen aus herzustellen.

Suchen Sie in Ihrer KI-Anwendung nach einer Möglichkeit, einen Remote-MCP-Server hinzuzufügen oder eine Verbindung zu ihm herzustellen. Geben Sie für den MCP-Server für die Datenherkunft die folgenden Informationen ein:

  • Servername: MCP-Server für die Datenherkunft
  • Server-URL oder Endpunkt:
    • Globaler Endpunkt: https://datalineage.googleapis.com/mcp
    • Regionale Endpunkte: https://REGION-datalineage.googleapis.com/mcp. Ersetzen Sie REGION durch eine der unterstützten Regionen.
  • Transport: HTTP
  • Authentifizierungsdetails: Je nachdem, wie Sie sich authentifizieren möchten, können Sie Ihre Anmeldedaten, Ihre OAuth-Client-ID und Ihren Clientschlüssel oder eine Agent-Identität und ‑Anmeldedaten eingeben. Google Cloud Weitere Informationen zur Authentifizierung finden Sie unter Bei MCP-Servern authentifizieren.
  • OAuth-Bereich: der OAuth 2.0-Bereich, den Sie verwenden möchten, wenn Sie eine Verbindung zum MCP-Server für die Datenherkunft herstellen.

Anwendungsspezifische Anleitungen zum Einrichten und Herstellen einer Verbindung zu einem MCP-Server finden Sie unter Clientspezifische Anleitung.

Allgemeinere Anleitungen finden Sie in den folgenden Ressourcen:

Verfügbare Tools

Details zu verfügbaren MCP-Tools und deren Beschreibungen für den MCP-Server für die Datenherkunft finden Sie in der MCP-Referenz für die Datenherkunft.

Tools auflisten

Verwenden Sie den MCP-Inspector, um Tools aufzulisten, oder senden Sie eine tools/list HTTP-Anfrage direkt an den Remote-MCP-Server für die Datenherkunft. Für die Methode tools/list ist keine Authentifizierung erforderlich.

POST /mcp HTTP/1.1
Host: datalineage.googleapis.com
Content-Type: application/json

{
  "method": "tools/list",
  "jsonrpc": "2.0",
  "id": 1
}

Beispielanwendungsfälle

Beispielanwendungsfälle für den MCP-Server für die Datenherkunft:

  • Alle vorgelagerten Datenquellen und Transformationsprozesse ermitteln, die in ein bestimmtes Daten-Asset einfließen, um Datenherkunft und ‑genauigkeit zu überprüfen.
  • Auswirkungen von fehlerhaften, angehaltenen oder verzögerten Datenpipelines auf nachgelagerte Datenverbraucher analysieren.

Beispiel-Prompts

  • „In meinem Projekt my-analytics-project habe ich ein Dataset sales_data mit einer Tabelle namens monthly_reports. Nennen Sie mir alle Daten-Assets und Transformationsprozesse, die Daten in diese Tabelle einfließen lassen.“
  • „Ich habe einen BigQuery-Job, der in die Tabelle hr_dataset.salary schreibt. Ich sehe, dass der Job seit 12 Stunden nicht ausgeführt wird. Können Sie mir sagen, welche nachgelagerten Assets aufgrund dieses Problems veraltete Daten enthalten?“
  • „Sehen Sie sich die Tabelle monthly_reports im Dataset sales_data und im Projekt my-analytics-project an, um alle Spalten mit vorgelagerten Datenquellen zu finden. Nennen Sie mir alle Prozesse, die in diese Spalten einfließen.“
  • „Suchen Sie nach Herkunftslinks, die mit der Tabelle finance.employment_costs verknüpft sind, um die vorgelagerten Abhängigkeiten zu ermitteln.“

Optionale Sicherheitskonfigurationen

MCP birgt neue Sicherheitsrisiken und ‑aspekte, da Sie mit den MCP-Tools eine Vielzahl von Aktionen ausführen können. Um diese Risiken zu minimieren und zu verwalten, Google Cloud bietet Standardeinstellungen und anpassbare Richtlinien, mit denen die Verwendung von MCP-Tools in Ihrer Google Cloud Organisation oder Ihrem Projekt gesteuert werden kann.

Weitere Informationen zu MCP-Sicherheit und ‑Governance finden Sie unter KI-Sicherheit und ‑Sicherheitsvorkehrungen.

MCP-Nutzung mit IAM-Ablehnungsrichtlinien steuern

Mit IAM-Ablehnungsrichtlinien (Identity and Access Management) können Sie Remote-MCP-Server schützen. Google Cloud Konfigurieren Sie diese Richtlinien, um den unerwünschten Zugriff auf MCP-Tools zu blockieren.

Sie können den Zugriff beispielsweise anhand der folgenden Kriterien ablehnen oder zulassen:

  • Prinzipal
  • Tool-Attribute wie „Schreibgeschützt“
  • OAuth-Client-ID der Anwendung

Weitere Informationen finden Sie unter MCP-Nutzung mit IAM steuern.

Nächste Schritte