בדף הזה מתואר התוכן של טבלת פרטי טרנספורמציה, ומוצגות דוגמאות לשאילתות שאפשר להריץ עליה.
כשמסירים את הפרטים המזהים מנתונים באחסון, אפשר להגדיר את משימת הבדיקה כך שתספק פרטים על כל שינוי שהיא מבצעת. Sensitive Data Protection כותב את הפרטים האלה בטבלה ב-BigQuery שאתם מציינים. במסמך הזה, הטבלה הזו נקראת טבלת פרטי השינוי.
התוכן של טבלת פרטי טרנספורמציה
בקטע הזה מפורטים תכני הטבלה של פרטי הטרנספורמציה ומוסבר עליהם.
resource_name
השם של עבודת הבדיקה שהשלימה את ההמרה.
container_name
הקובץ שמכיל את הנתונים שעברו טרנספורמציה.
טרנספורמציה
פרטים על הטרנספורמציה. השדה הזה מכיל את המאפיינים הבאים:
- סוג
שיטת הטרנספורמציה ש-Sensitive Data Protection החיל על הממצא. אלה כמה מהערכים האפשריים:
- description
ייצוג מחרוזת של הטרנספורמציה. הערך הוא הפלט של קריאה לפונקציה
toString()בהודעת מאגר אחסון לפרוטוקוליםPrimitiveTransformationלכל סוגי ההמרות, למעטRecordSuppression. אם שיטת הטרנספורמציה היא השמטה של רשומה, השדה הזה ריק.- תנאי
ייצוג מחרוזת של
RecordConditionלטרנספורמציה. השדה הזה מוגדר רק אם נעשה שימוש בתנאי של רשומה כדי לקבוע אם Sensitive Data Protection צריכה לחול על השינוי. דוגמאות:(age_field <= 18)(zip_field exists)(zip_field == 01234) && (age_field <= 18) && (city_field exists)
- infoType
פרטים על סוג המידע שזוהה בממצא. השדה הזה כולל את המאפיינים הבאים:
- name
- השם של התכונה המובנית או התכונה בהתאמה אישית
infoType. - גרסה
- גרסה של
infoType.
status_details
פרטים על סטטוס הטרנספורמציה. אם הטרנספורמציה נכשלה, בשדה הזה מצוין מה גרם לכשל. השדה הזה מכיל את המאפיינים הבאים:
- result_status_type
קוד שמייצג את הסטטוס של ניסיון ההמרה. אלה הערכים האפשריים:
-
STATE_TYPE_UNSPECIFIED: Sensitive Data Protection לא הצליח לקבוע את הסטטוס של השינוי. -
INVALID_TRANSFORM: לא הייתה אפשרות להפוך את הממצא ב-Sensitive Data Protection. -
METADATA_UNRETRIEVABLE: יש ממצא במטא-נתונים המותאמים אישית של קובץ. בזמן כתיבת הקובץ שעבר טרנספורמציה, Sensitive Data Protection לא הצליחה לאחזר את המטא-נתונים. -
SUCCESS: הטרנספורמציה בוצעה בהצלחה.
-
- פרטים
פרטים נוספים על הסטטוס. השדה הזה פועל לפי המפרטים שמוגדרים ב-
Status. השדה הזה מכיל את המאפיינים הבאים:- קוד
- קוד השגיאה.
- הודעה
- הודעת השגיאה.
- פרטים
- רשימה של הודעות שמכילות את פרטי השגיאה.
transformed_bytes
מספר הבייטים שעברו טרנספורמציה באמצעות Sensitive Data Protection. אם ההמרה לא הצליחה או אם לא היה תוכן להמרה, הערך הוא 0.
transformation_location
פרטים על המיקום של הטרנספורמציה.
הדוגמה הבאה היא של מיקום טרנספורמציה ב-JSON, שבו בוצעה טרנספורמציה של infoType על ידי Sensitive Data Protection:
{
"finding_id": "2022-05-23T23:51:29.775337Z831678185946560283",
"record_transformation": null,
"container_type": "TRANSFORM_BODY"
}
הדוגמה הבאה היא של מיקום טרנספורמציה בפורמט JSON, שבו בוצעה טרנספורמציה של רשומה על ידי Sensitive Data Protection:
{
"finding_id": null,
"record_transformation": {
"field_id": {
"name": " \"Name\""
},
"container_timestamp": {
"timestamp": null,
"seconds": "1654796423",
"nanos": "763000000"
},
"container_version": "1654796423733485"
},
"container_type": "TRANSFORM_TABLE"
}
}
כפי שאפשר לראות בדוגמאות, Sensitive Data Protection מאכלס את finding_id או את record_transformation, בהתאם לסוג הטרנספורמציה שהוא ביצע.
שני השדות הם בלעדיים הדדית.
- finding_id
- השדה הזה מוגדר אם Sensitive Data Protection ביצע טרנספורמציה של Infotype. כל מזהה ממצא מתייחס לרשומה בטבלת הפלט של הממצאים. טבלת הפלט של הממצאים מכילה את כל הממצאים שזוהו על ידי Sensitive Data Protection במהלך הבדיקה. הטבלה הזו נוצרת רק אם הגדרתם את משימת הבדיקה לשמירת הממצאים ב-BigQuery.
- record_transformation
השדה הזה מוגדר אם Sensitive Data Protection ביצע טרנספורמציה של רשומה בנתונים טבלאיים. השדה הזה מכיל את המאפיינים הבאים:
- field_id
- העמודה בטבלה שמכילה את הממצא.
- container_timestamp
- חותמת הזמן של השינוי שבוצע בקובץ.
- container_version
- מספר דור של הקובץ שמכיל את הממצא.
- container_type
מידע על הפונקציונליות של הנתונים שמכילים את הממצא. אלה הערכים האפשריים:
-
TRANSFORM_UNKNOWN_CONTAINER: Sensitive Data Protection לא הצליח לקבוע את סוג הנתונים שמכילים את הממצא. -
TRANSFORM_BODY: Sensitive Data Protection זיהה את הממצא בגוף הקובץ. -
TRANSFORM_METADATA: Sensitive Data Protection זיהה את הממצא במטא-נתונים של קובץ. -
TRANSFORM_TABLE: Sensitive Data Protection זיהה את הממצא בטבלה.
-
שאילתות לדוגמה
ריכזנו כאן כמה דוגמאות לשאילתות שאפשר להריץ בטבלת פרטי ההמרה. מידע על שליחת שאילתות לטבלה ב-BigQuery זמין במאמר הרצת שאילתות אינטראקטיביות.
בחירת כל הטרנספורמציות שנכשלו
SELECT *
FROM `PROJECT_ID.DATASET_ID.TABLE_ID`
WHERE status_details.result_status_type != "SUCCESS";
מחליפים את מה שכתוב בשדות הבאים:
-
PROJECT_ID: מזהה הפרויקט שמכיל את הטבלה עם פרטי ההמרה. -
DATASET_ID: המזהה של מערך הנתונים ב-BigQuery שמכיל את טבלת פרטי ההמרה. -
TABLE_ID: המזהה של טבלת פרטי השינוי.
ספירת מספר הקבצים שההמרה שלהם נכשלה
SELECT COUNT(DISTINCT(container_name))
FROM `PROJECT_ID.DATASET_ID.TABLE_ID`
WHERE status_details.result_status_type != "SUCCESS";
בחירת כל הטרנספורמציות שנעשה בהן שימוש בהסתרת תווים
SELECT resource_name, container_name, info_type.name
FROM `PROJECT_ID.DATASET_ID.TABLE_ID`,
UNNEST(transformation) AS tr
WHERE tr.type LIKE "CHARACTER_MASK";
המאמרים הבאים
- מידע נוסף על תהליך הסרת הפרטים המזהים מנתונים באחסון
- איך מבטלים את הזיהוי של נתונים באחסון באמצעות Google Cloud המסוף
- איך מסירים את הפרטים המזהים ממידע אישי רגיש שמאוחסן ב-Cloud Storage באמצעות DLP API
- עבודה עם המדריך המעשי ליצירת עותק של נתונים שעברו הסרת פרטים מזהים ב-Cloud Storage.
- מידע נוסף על טרנספורמציות להסרת פרטי הזיהוי