In diesem Szenario erhalten Sie eine Benachrichtigung, dass in einer für die gesamte Organisation sichtbaren Ansicht sensible Kundendaten (insbesondere Vor- und Nachnamen) enthalten sind.
Diese Informationen sind ursprünglich nur für bestimmte funktionale Zwecke vorgesehen, z. B. für die Kontoerstellung, Rechnungsstellung und den Versand. Durch eine Reihe von Transformationen und die Erstellung einer Analyseansicht gelangen die personenidentifizierbaren Informationen jedoch in ein umfassenderes Analyseschema.
In dieser Anleitung verwenden Sie die Herkunft der Daten, um den Fluss sensibler Daten bis zu dem Prozess zurückzuverfolgen, der sie von einem vertrauenswürdigen an einen nicht vertrauenswürdigen Ort verschiebt.
Jetzt starten
Um den Anwendungsfall abzuschließen, müssen Sie zuerst die Umgebung einrichten und die Datentransformationen ausführen. Auf der Seite Voraussetzungen und Einrichtung können Sie ein Remote-Repository mit Dataform verbinden. Dieses Repository enthält den Code, der zum Einrichten des Datasets und zum Transformieren der Daten erforderlich ist.
Nachdem Sie die Umgebung eingerichtet haben, können Sie mit BigQuery und Lineage Explorer ermitteln, wo personenidentifizierbare Informationen eine Sicherheitsgrenze überschreiten.
Lecks personenbezogener Daten mit dem Lineage Explorer analysieren
Nachdem Sie das Dataset vorbereitet haben, können Sie das Leck personenbezogener Daten über den Tab Lineage in BigQuery nachvollziehen.
In diesem Beispiel verfolgen Sie die Spalte user_email aus der öffentlichen Ansicht zurück zur Quelle:
- Rufen Sie in der Google Cloud Console die Seite BigQuery auf.
- Suchen Sie über das Suchfeld nach der Tabelle
order_status_stats. - Klicken Sie auf den Tab Lineage.
- Führen Sie im Bereich Lineage Explorer die folgenden Schritte aus:
- Wählen Sie im Abschnitt Spaltenbezogene Herkunft den Spaltennamen
user_emailaus der Liste aus. - Wählen Sie im Abschnitt Richtung die Richtung Upstream aus.
- Klicken Sie auf Übernehmen.
- Wählen Sie im Abschnitt Spaltenbezogene Herkunft den Spaltennamen
- Gehen Sie im Diagramm einen Schritt zurück. Das Diagramm zeigt, dass die E‑Mail aus der Zwischenansicht
status_counts_by_user_vabgerufen wird. - Klicken Sie auf den Prozessknoten zwischen der Ansicht und den zugehörigen Upstream-Abhängigkeiten. Der Prozessknoten zeigt, dass ein Join-Vorgang zwischen anonymisierten Bestelldaten und einer Tabelle mit Identitätsinformationen stattfindet.
Der Datenursprung beweist, dass personenbezogene Daten aus einer eingeschränkten funktionalen Tabelle in ein umfassenderes Analyseschema übertragen werden, in dem sie von unbefugten Nutzern eingesehen werden können.
Weitere Informationen zum Visualisieren von Daten mit dem Datenherkunftsdiagramm finden Sie unter Ansicht „Herkunftsdiagramm“.