במאמר הזה מוסבר בפירוט איך ליצור עבודת בדיקה של Sensitive Data Protection, ואיך לתזמן עבודות בדיקה חוזרות על ידי יצירת טריגר לעבודה. במאמר תחילת העבודה המהירה: יצירת טריגר להפעלת Sensitive Data Protection מוסבר איך ליצור טריגר חדש להפעלת Sensitive Data Protection באמצעות ממשק המשתמש.
מידע על משימות בדיקה וטריגרים של משימות
כש-Sensitive Data Protection מבצע סריקה כדי לזהות מידע אישי רגיש, כל סריקה מופעלת כמשימה. Sensitive Data Protection יוצר ומריץ משאב מסוג job בכל פעם שמבקשים ממנו לבדוק את מאגרי האחסון, כולל קטגוריות של Cloud Storage, טבלאות של BigQuery, סוגי נתונים של Datastore ונתונים חיצוניים. Google Cloud
כדי לתזמן משימות סריקה של בדיקות Sensitive Data Protection, יוצרים טריגרים למשימות. טריגר של משימה מאפשר ליצור משימות של Sensitive Data Protection באופן אוטומטי על בסיס תקופתי, ואפשר גם להריץ אותו לפי דרישה.
מידע נוסף על משימות וטריגרים של משימות ב-Sensitive Data Protection זמין בדף המושגים בנושא משימות וטריגרים של משימות.
יצירת משימת בדיקה חדשה
כדי ליצור משימת בדיקה חדשה של Sensitive Data Protection:
המסוף
בקטע Sensitive Data Protection במסוף Google Cloud , עוברים לדף Create job or job trigger.
מעבר אל יצירת משימה או טריגר למשימה
הדף Create job or job trigger כולל את הקטעים הבאים:
בחירת נתוני קלט
שם
מזינים שם למשרה. אפשר להשתמש באותיות, במספרים ובמקפים. הוספת שם למשרה היא אופציונלית. אם לא תזינו שם, המערכת של Sensitive Data Protection תקצה לעבודה מזהה מספרי ייחודי.
מיקום
בתפריט סוג האחסון, בוחרים את סוג המאגר שבו מאוחסנים הנתונים שרוצים לסרוק:
- Cloud Storage: מזינים את כתובת ה-URL של הקטגוריה שרוצים לסרוק, או בוחרים באפשרות הכללה/החרגה בתפריט סוג המיקום ואז לוחצים על עיון כדי לעבור לקטגוריה או לתיקיית המשנה שרוצים לסרוק. מסמנים את התיבה סריקת התיקייה באופן רקורסיבי כדי לסרוק את הספרייה שצוינה ואת כל הספריות שכלולות בה. כדי לסרוק רק את הספרייה שצוינה ולא לעומק, צריך להשאיר את התיבה הזו לא מסומנת.
- BigQuery: מזינים את המזהים של הפרויקט, מערך הנתונים והטבלה שרוצים לסרוק.
- Datastore: מזינים את המזהים של הפרויקט, מרחב השמות (אופציונלי) והסוג שרוצים לסרוק.
- היברידי: אפשר להוסיף תוויות חובה, תוויות אופציונליות ואפשרויות לטיפול בנתונים טבלאיים. מידע נוסף זמין במאמר בנושא סוגי המטא-נתונים שאפשר לספק.
דגימות
דגימה היא דרך אופציונלית לחסוך במשאבים אם יש לכם כמות גדולה מאוד של נתונים.
בקטע דגימה, אפשר לבחור אם לסרוק את כל הנתונים שנבחרו או לדגום את הנתונים על ידי סריקה של אחוז מסוים. הדגימה פועלת בצורה שונה בהתאם לסוג מאגר האחסון שסורקים:
- ב-BigQuery, אפשר לדגום קבוצת משנה של השורות שנבחרו, בהתאם לאחוז הקבצים שצוין לכלול בסריקה.
- ב-Cloud Storage, אם קובץ כלשהו גדול מהגודל שצוין בגודל המקסימלי בבייט לסריקה לכל קובץ, מערכת Sensitive Data Protection סורקת אותו עד לגודל המקסימלי הזה ואז עוברת לקובץ הבא.
כדי להפעיל את הדגימה, בוחרים באחת מהאפשרויות הבאות מהתפריט הראשון:
- התחלת הדגימה מההתחלה: Sensitive Data Protection מתחיל את הסריקה החלקית בתחילת הנתונים. ב-BigQuery, הסריקה מתחילה בשורה הראשונה. ב-Cloud Storage, הסריקה מתחילה בתחילת כל קובץ ומפסיקה אחרי ש-Sensitive Data Protection סורק עד לגודל קובץ מקסימלי שצוין.
- התחלת דגימה מנקודת התחלה אקראית: Sensitive Data Protection מתחיל את הסריקה החלקית במיקום אקראי בתוך הנתונים. ב-BigQuery, הסריקה מתחילה בשורה אקראית. ב-Cloud Storage, ההגדרה הזו חלה רק על קבצים שגדולים מהגודל המקסימלי שצוין. Sensitive Data Protection סורק קבצים בגודל שקטן מהגודל המקסימלי של הקובץ במלואם, וסורק קבצים בגודל שגדול מהגודל המקסימלי של הקובץ עד לגודל המקסימלי.
כדי לבצע סריקה חלקית, צריך גם לבחור את אחוז הנתונים שרוצים לסרוק. משתמשים בפס ההזזה כדי להגדיר את האחוז.
אפשר גם לצמצם את הקבצים או הרשומות לסריקה לפי תאריך. בהמשך המאמר מוסבר איך מתזמנים.
הגדרה מתקדמת
כשיוצרים עבודה לסריקה של קטגוריות Cloud Storage או טבלאות BigQuery, אפשר לצמצם את החיפוש על ידי ציון הגדרה מתקדמת. באופן ספציפי, אתם יכולים להגדיר:
- קבצים (רק ב-Cloud Storage): סוגי הקבצים שצריך לסרוק, כולל קובצי טקסט, קובצי בינאריים וקובצי תמונה.
- שדות מזהים (ב-BigQuery בלבד): מזהים ייחודיים של שורות בטבלה.
- ב-Cloud Storage, אם קובץ כלשהו גדול מהגודל שצוין בגודל המקסימלי בבייט לסריקה לכל קובץ, מערכת Sensitive Data Protection סורקת אותו עד לגודל המקסימלי הזה ואז עוברת לקובץ הבא.
כדי להפעיל דגימה, בוחרים את אחוז הנתונים שרוצים לסרוק. משתמשים בפס ההזזה כדי להגדיר את האחוז. לאחר מכן, בוחרים באחת מהאפשרויות הבאות מהתפריט הראשון:
- התחלת הדגימה מההתחלה: Sensitive Data Protection מתחיל את הסריקה החלקית בתחילת הנתונים. ב-BigQuery, הסריקה מתחילה בשורה הראשונה. ב-Cloud Storage, הסריקה מתחילה בתחילת כל קובץ ומפסיקה כשהכלי Sensitive Data Protection מסיים לסרוק עד לגודל קובץ מקסימלי שצוין (כמו שמתואר למעלה).
- התחלת דגימה מנקודת התחלה אקראית: Sensitive Data Protection מתחיל את הסריקה החלקית במיקום אקראי בתוך הנתונים. ב-BigQuery, הסריקה מתחילה בשורה אקראית. ב-Cloud Storage, ההגדרה הזו חלה רק על קבצים שגדולים מהגודל המקסימלי שצוין. Sensitive Data Protection סורק קבצים בגודל שקטן מהגודל המקסימלי של הקובץ במלואם, וסורק קבצים בגודל שגדול מהגודל המקסימלי של הקובץ עד לגודל המקסימלי.
קבצים
אם הקבצים מאוחסנים ב-Cloud Storage, אפשר לציין את הסוגים שייכללו בסריקה בקטע קבצים.
אפשר לבחור מבין קבצים בינאריים, קובצי טקסט, קובצי תמונה, קובצי CSV, קובצי TSV, קובצי Microsoft Word, קובצי Microsoft Excel, קובצי Microsoft Powerpoint, קובצי PDF וקובצי Apache Avro. רשימה מלאה של סיומות קבצים ש-Sensitive Data Protection יכול לסרוק בקטגוריות של Cloud Storage מופיעה במאמר FileType.
אם בוחרים באפשרות Binary, המערכת של Sensitive Data Protection סורקת קבצים מסוגים לא מזוהים.
זיהוי שדות
בטבלאות ב-BigQuery, בשדה Identifying fields (שדות לזיהוי), אפשר להגדיר ל-Sensitive Data Protection לכלול בתוצאות את הערכים של עמודות המפתח הראשי של הטבלה. כך תוכלו לקשר את הממצאים לשורות בטבלה שמכילות אותם.
מזינים את שמות העמודות שמזהות באופן ייחודי כל שורה בטבלה. אם יש צורך, אפשר להשתמש בסימון נקודות כדי לציין שדות מקוננים. אפשר להוסיף כמה שדות שרוצים.
כדי לייצא את הממצאים ל-BigQuery, צריך גם להפעיל את הפעולה שמירה ב-BigQuery. כשמייצאים את הממצאים ל-BigQuery, כל ממצא מכיל את הערכים המתאימים של השדות המזהים. מידע נוסף זמין במאמר identifyingFields.
הגדרת זיהוי
בקטע הגדרת זיהוי מציינים את סוגי המידע האישי הרגיש שרוצים לסרוק. השלמת הקטע הזה היא אופציונלית. אם מדלגים על הקטע הזה, Sensitive Data Protection יסרוק את הנתונים שלכם כדי למצוא קבוצת ברירת מחדל של infoTypes.
תבנית
אפשר גם להשתמש בתבנית של Sensitive Data Protection כדי לעשות שימוש חוזר בפרטי ההגדרה שציינתם בעבר.
אם כבר יצרתם תבנית שבה אתם רוצים להשתמש, לוחצים על השדה שם התבנית כדי לראות רשימה של תבניות בדיקה קיימות. בוחרים או מקלידים את שם התבנית שבה רוצים להשתמש.
מידע נוסף על יצירת תבניות זמין במאמר יצירת תבניות לבדיקת Sensitive Data Protection.
InfoTypes
גלאי InfoType מוצאים מידע אישי רגיש מסוג מסוים. לדוגמה, US_SOCIAL_SECURITY_NUMBERגלאי ה-infoType המובנה של Sensitive Data Protection
מוצא מספרי ביטוח לאומי בארה"ב. בנוסף למזהי infoType המובנים, אתם יכולים ליצור מזהי infoType מותאמים אישית משלכם.
בקטע InfoTypes, בוחרים את אמצעי הזיהוי של סוג המידע שמתאים לסוג הנתונים שרוצים לסרוק. לא מומלץ להשאיר את הקטע הזה ריק. במקרה כזה, Sensitive Data Protection יסרוק את הנתונים שלכם עם קבוצת ברירת מחדל של infoTypes, שיכול להיות שתכלול infoTypes שלא נחוצים לכם. מידע נוסף על כל גלאי זמין במאמר חומר עזר בנושא גלאי Infotype.
מידע נוסף על ניהול של סוגי מידע מובנים ובהתאמה אישית מופיע בקטע ניהול סוגי מידע דרך מסוף Google Cloud .
ערכות כללים לבדיקה
ערכות כללים לבדיקה מאפשרות לכם להתאים אישית גלאים מובנים וגלאים מותאמים אישית של infoType באמצעות כללי הקשר. סוגי כללי הבדיקה הם:
- כללי החרגה, שעוזרים להחריג ממצאים שגויים או לא רצויים.
- כללים למילות הפעלה, שעוזרים לזהות ממצאים נוספים.
- כללי התאמה, שמתאימים את הסבירות לממצאים על סמך ההקשר שבו הם מופיעים.
כדי להוסיף קבוצת כללים חדשה, קודם צריך לציין גלאי infoType מובנה או מותאם אישית אחד או יותר בקטע InfoTypes. בוחרים את כל הגלאים של סוגי המידע שערכות הכללים משנות (סוגי המידע שמוגדרים כיעד) או משמשים להערכה (סוגי המידע שמוגדרים כהקשר). לאחר מכן, מבצעים את הפעולות הבאות:
- לוחצים על הוספת קבוצת כללים.
- בשדה בחירת סוגי מידע לטירגוט, בוחרים את סוגי המידע שהכללים ישנו אם התנאים יתקיימו.
- לוחצים על הוספת כלל כדי לפתוח תפריט עם אפשרויות, כולל כלל מילת הפעלה, כלל החרגה וכלל התאמה.
כדי ליצור כלל למילת הפעלה, בוחרים באפשרות כלל למילת הפעלה. לאחר מכן, מבצעים את הפעולות הבאות:
- בשדה מילת הפעלה מזינים ביטוי רגולרי ש-Sensitive Data Protection מחפש.
- בתפריט קרבה למילת ההפעלה, בוחרים אם מילת ההפעלה שהזנתם נמצאת לפני או אחרי סוג המידע שנבחר.
- בקטע Hotword distance from infoType (מרחק מילת החיפוש מסוג המידע), מזינים את מספר התווים המשוער בין מילת החיפוש לבין סוג המידע שנבחר.
- בקטע התאמה של רמת הסמך, בוחרים אם להקצות להתאמות רמת סבירות קבועה, או להגדיל או להקטין את רמת הסבירות שמוגדרת כברירת מחדל בסכום מסוים.
כדי ליצור כלל החרגה, בוחרים באפשרות כלל החרגה ואת סוג כלל ההחרגה שרוצים ליצור, למשל ביטוי רגולרי. לאחר מכן, מבצעים את הפעולות הבאות:
- בהתאם לסוג כלל ההחרגה שבחרתם, מזינים את הביטוי הרגולרי, את הניסוח, את מילת ההפעלה או את סוג המידע של ההקשר שצריך למצוא כדי שהכלל יחול.
- בהתאם לסוג כלל ההחרגה שבחרתם, מגדירים את סוג ההתאמה או את סוג ההכלה של התמונה:
- אם בחרתם כלל החרגה מבוסס-טקסט, בוחרים באחד מסוגי ההתאמה הבאים:
- התאמה מלאה: הממצא חייב להיות זהה לחלוטין לטקסט או למידע על סוג ההקשר שסיפקתם.
- התאמה חלקית: מחרוזת משנה בתוצאת החיפוש צריכה להיות זהה לטקסט או למידע על סוג ההקשר שסיפקתם.
- התאמה הפוכה: הממצא לא יכול להיות זהה לטקסט או למידע על סוג המידע שסיפקתם.
- אם בחרתם כלל החרגה שמבוסס על תמונה, בוחרים את היחס המרחבי הנדרש בין סוגי המידע של היעד וההקשר. לדוגמה, אם בוחרים באפשרות Encloses (מכיל), הממצא של ההקשר צריך להכיל את ממצא היעד כדי שהכלל יחול.
כדי ליצור כלל התאמה, בוחרים באפשרות כלל התאמה ואת סוג כלל ההתאמה, לדוגמה, התאמה לפי ממצאי תמונות. לאחר מכן, מבצעים את הפעולות הבאות:
- בשדה Context infoTypes, בוחרים את הגלאים של סוגי המידע שמספקים הקשר לתוצאת החיפוש. Sensitive Data Protection משתמש ב-infoTypes של הקשר כדי להעריך אם צריך לשנות את infoType היעד.
- בשדה Minimum likelihood, בוחרים את רמת הסבירות הנמוכה ביותר שסוגי המידע של ההקשר יכולים לקבל ועדיין להפעיל את כלל ההתאמה. אם ערך הסבירות של כל ממצא של הקשר שזוהה נמוך מהערך הזה, Sensitive Data Protection לא משנה את הסבירות של ממצא היעד.
- בממצאים שקשורים לתמונות, בשדה סוג ההכלה של התמונה, בוחרים את היחס המרחבי הנדרש בין סוגי המידע של היעד וההקשר. לדוגמה, אם בוחרים באפשרות Encloses (מכיל), המערכת תחיל את הכלל רק אם הממצא בהקשר מכיל את ממצא היעד.
- בשדה סבירות, בוחרים את רמת הסבירות החדשה שרוצים להקצות לממצא היעד.
אפשר להוסיף עוד קבוצות כללים כדי לשפר את תוצאות הסריקה.
סף ביטחון
בכל פעם ש-Sensitive Data Protection מזהה התאמה פוטנציאלית למידע אישי רגיש, הוא מקצה לו ערך הסתברות בסולם שנע בין 'מאוד לא סביר' ל'מאוד סביר'. כשמגדירים כאן ערך סבירות, נותנים ל-Sensitive Data Protection הוראה להתאים רק נתונים שערך הסבירות שלהם שווה לערך הזה או גבוה ממנו.
ערך ברירת המחדל 'אפשרי' מספיק לרוב המטרות. אם אתם מקבלים באופן קבוע התאמות רחבות מדי, כדאי להזיז את פס ההזזה למעלה. אם מקבלים מעט מדי התאמות, מזיזים את פס ההזזה למטה.
בסיום, לוחצים על המשך.
הוספת פעולות
בקטע Add actions (הוספת פעולות), בוחרים פעולה אחת או יותר שרוצים שמערכת Sensitive Data Protection תבצע אחרי שהעבודה תסתיים. מידע נוסף זמין במאמר בנושא הפעלת פעולות של בדיקה או ניתוח סיכונים.
אחרי שבוחרים פעולות, לוחצים על המשך.
בדיקה
בקטע Review (בדיקה) מופיע סיכום של הגדרות העבודה שציינתם, בפורמט JSON.
לוחצים על Create כדי ליצור את העבודה (אם לא ציינתם לוח זמנים) ולהפעיל אותה פעם אחת. מופיע דף המידע על המשרה, שכולל את הסטטוס ומידע נוסף. אם העבודה פועלת כרגע, אפשר ללחוץ על הלחצן ביטול כדי לעצור אותה. אפשר גם למחוק את העבודה בלחיצה על מחיקה.
כדי לחזור לדף הראשי של Sensitive Data Protection, לוחצים על החץ חזרה במסוף Google Cloud .
C#
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Go
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Java
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Node.js
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
PHP
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Python
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
REST
משרה מיוצגת ב-DLP API על ידי מקור המידע DlpJobs. אפשר ליצור משימה חדשה באמצעות המשאב DlpJob והשיטה projects.dlpJobs.create.
אפשר לשלוח את ה-JSON לדוגמה הזה בבקשת POST לנקודת הקצה שצוינה של REST של Sensitive Data Protection. בדוגמה הבאה של JSON אפשר לראות איך יוצרים עבודה ב-Sensitive Data Protection. המשימה היא סריקת בדיקה של Datastore.
כדי לנסות את זה במהירות, אפשר להשתמש ב-API Explorer שמוטמע בהמשך. חשוב לזכור שבקשה שמוגשת בהצלחה, גם אם היא נוצרה ב-API Explorer, תיצור משימה. מידע כללי על שימוש ב-JSON לשליחת בקשות ל-DLP API זמין במדריך לתחילת העבודה עם JSON.
קלט JSON:
{
"inspectJob": {
"storageConfig": {
"bigQueryOptions": {
"tableReference": {
"projectId": "bigquery-public-data",
"datasetId": "san_francisco_sfpd_incidents",
"tableId": "sfpd_incidents"
}
},
"timespanConfig": {
"startTime": "2020-01-01T00:00:01Z",
"endTime": "2020-01-31T23:59:59Z",
"timestampField": {
"name": "timestamp"
}
}
},
"inspectConfig": {
"infoTypes": [
{
"name": "PERSON_NAME"
},
{
"name": "STREET_ADDRESS"
}
],
"excludeInfoTypes": false,
"includeQuote": true,
"minLikelihood": "LIKELY"
},
"actions": [
{
"saveFindings": {
"outputConfig": {
"table": {
"projectId": "[PROJECT-ID]",
"datasetId": "[DATASET-ID]"
}
}
}
}
]
}
}
פלט JSON:
הפלט הבא מציין שהמשימה נוצרה בהצלחה.
{
"name": "projects/[PROJECT-ID]/dlpJobs/[JOB-ID]",
"type": "INSPECT_JOB",
"state": "PENDING",
"inspectDetails": {
"requestedOptions": {
"snapshotInspectTemplate": {},
"jobConfig": {
"storageConfig": {
"bigQueryOptions": {
"tableReference": {
"projectId": "bigquery-public-data",
"datasetId": "san_francisco_sfpd_incidents",
"tableId": "sfpd_incidents"
}
},
"timespanConfig": {
"startTime": "2020-01-01T00:00:01Z",
"endTime": "2020-01-31T23:59:59Z",
"timestampField": {
"name": "timestamp"
}
}
},
"inspectConfig": {
"infoTypes": [
{
"name": "PERSON_NAME"
},
{
"name": "STREET_ADDRESS"
}
],
"minLikelihood": "LIKELY",
"limits": {},
"includeQuote": true
},
"actions": [
{
"saveFindings": {
"outputConfig": {
"table": {
"projectId": "[PROJECT-ID]",
"datasetId": "[DATASET-ID]",
"tableId": "[TABLE-ID]"
}
}
}
}
]
}
},
"result": {}
},
"createTime": "2020-07-10T07:26:33.643Z"
}
יצירת טריגר חדש להפעלת משימה
כדי ליצור טריגר חדש להפעלת משימה של Sensitive Data Protection:
המסוף
בקטע Sensitive Data Protection במסוף Google Cloud , עוברים לדף Create job or job trigger.
מעבר אל יצירת משימה או טריגר למשימה
הדף Create job or job trigger כולל את הקטעים הבאים:
בחירת נתוני קלט
שם
מזינים שם לטריגר של המשימה. אפשר להשתמש באותיות, במספרים ובמקפים. מתן שם לטריגר של המשימה הוא אופציונלי. אם לא תזינו שם, Sensitive Data Protection תקצה לטריגר של העבודה מזהה מספרי ייחודי.
מיקום
בתפריט סוג האחסון, בוחרים את סוג המאגר שבו מאוחסנים הנתונים שרוצים לסרוק:
- Cloud Storage: מזינים את כתובת ה-URL של הקטגוריה שרוצים לסרוק, או בוחרים באפשרות הכללה/החרגה בתפריט סוג המיקום ואז לוחצים על עיון כדי לעבור לקטגוריה או לתיקיית המשנה שרוצים לסרוק. מסמנים את התיבה סריקת התיקייה באופן רקורסיבי כדי לסרוק את הספרייה שצוינה ואת כל הספריות שכלולות בה. כדי לסרוק רק את הספרייה שצוינה ולא לעומק, צריך להשאיר את התיבה הזו לא מסומנת.
- BigQuery: מזינים את המזהים של הפרויקט, מערך הנתונים והטבלה שרוצים לסרוק.
- Datastore: מזינים את המזהים של הפרויקט, מרחב השמות (אופציונלי) והסוג שרוצים לסרוק.
דגימות
דגימה היא דרך אופציונלית לחסוך במשאבים אם יש לכם כמות גדולה מאוד של נתונים.
בקטע דגימה, אפשר לבחור אם לסרוק את כל הנתונים שנבחרו או לדגום את הנתונים על ידי סריקה של אחוז מסוים. הדגימה פועלת בצורה שונה בהתאם לסוג מאגר האחסון שסורקים:
- ב-BigQuery, אפשר לדגום קבוצת משנה של השורות שנבחרו, בהתאם לאחוז הקבצים שצוין לכלול בסריקה.
- ב-Cloud Storage, אם קובץ כלשהו גדול מהגודל שצוין בגודל המקסימלי בבייט לסריקה לכל קובץ, מערכת Sensitive Data Protection סורקת אותו עד לגודל המקסימלי הזה ואז עוברת לקובץ הבא.
כדי להפעיל את הדגימה, בוחרים באחת מהאפשרויות הבאות מהתפריט הראשון:
- התחלת הדגימה מההתחלה: Sensitive Data Protection מתחיל את הסריקה החלקית בתחילת הנתונים. ב-BigQuery, הסריקה מתחילה בשורה הראשונה. ב-Cloud Storage, הסריקה מתחילה בתחילת כל קובץ ומפסיקה כשהכלי Sensitive Data Protection מסיים לסרוק עד לגודל קובץ מקסימלי שצוין (כמו שמתואר למעלה).
- התחלת דגימה מנקודת התחלה אקראית: Sensitive Data Protection מתחיל את הסריקה החלקית במיקום אקראי בתוך הנתונים. ב-BigQuery, הסריקה מתחילה בשורה אקראית. ב-Cloud Storage, ההגדרה הזו חלה רק על קבצים שגדולים מהגודל המקסימלי שצוין. Sensitive Data Protection סורק קבצים בגודל שקטן מהגודל המקסימלי של הקובץ במלואם, וסורק קבצים בגודל שגדול מהגודל המקסימלי של הקובץ עד לגודל המקסימלי.
כדי לבצע סריקה חלקית, צריך גם לבחור את אחוז הנתונים שרוצים לסרוק. משתמשים בפס ההזזה כדי להגדיר את האחוז.
הגדרה מתקדמת
כשיוצרים טריגר להפעלת סריקה של מאגרי Cloud Storage או טבלאות BigQuery, אפשר לצמצם את החיפוש באמצעות הגדרה מתקדמת. באופן ספציפי, אתם יכולים להגדיר:
- קבצים (רק ב-Cloud Storage): סוגי הקבצים שצריך לסרוק, כולל קובצי טקסט, קובצי בינאריים וקובצי תמונה.
- שדות מזהים (ב-BigQuery בלבד): מזהים ייחודיים של שורות בטבלה.
- ב-Cloud Storage, אם קובץ כלשהו גדול מהגודל שצוין בגודל המקסימלי בבייט לסריקה לכל קובץ, מערכת Sensitive Data Protection סורקת אותו עד לגודל המקסימלי הזה ואז עוברת לקובץ הבא.
כדי להפעיל דגימה, בוחרים את אחוז הנתונים שרוצים לסרוק. משתמשים בפס ההזזה כדי להגדיר את האחוז. לאחר מכן, בוחרים באחת מהאפשרויות הבאות מהתפריט הראשון:
- התחלת הדגימה מההתחלה: Sensitive Data Protection מתחיל את הסריקה החלקית בתחילת הנתונים. ב-BigQuery, הסריקה מתחילה בשורה הראשונה. ב-Cloud Storage, הסריקה מתחילה בתחילת כל קובץ ומפסיקה כשהכלי Sensitive Data Protection מסיים לסרוק עד לגודל קובץ מקסימלי שצוין (כמו שמתואר למעלה).
- התחלת דגימה מנקודת התחלה אקראית: Sensitive Data Protection מתחיל את הסריקה החלקית במיקום אקראי בתוך הנתונים. ב-BigQuery, הסריקה מתחילה בשורה אקראית. ב-Cloud Storage, ההגדרה הזו חלה רק על קבצים שגדולים מהגודל המקסימלי שצוין. Sensitive Data Protection סורק קבצים בגודל שקטן מהגודל המקסימלי של הקובץ במלואם, וסורק קבצים בגודל שגדול מהגודל המקסימלי של הקובץ עד לגודל המקסימלי.
קבצים
אם הקבצים מאוחסנים ב-Cloud Storage, אפשר לציין את הסוגים שייכללו בסריקה בקטע קבצים.
אפשר לבחור בין קבצים בינאריים, קובצי טקסט, קובצי תמונה, קובצי Microsoft Word, קובצי Microsoft Excel, קובצי Microsoft Powerpoint, קובצי PDF וקובצי Apache Avro. רשימה מלאה של סיומות קבצים ש-Sensitive Data Protection יכול לסרוק בקטגוריות של Cloud Storage זמינה במאמר FileType.
אם בוחרים באפשרות Binary, המערכת של Sensitive Data Protection סורקת קבצים מסוגים לא מזוהים.
זיהוי שדות
בטבלאות ב-BigQuery, בשדה Identifying fields (שדות לזיהוי), אפשר להגדיר ל-Sensitive Data Protection לכלול בתוצאות את הערכים של עמודות המפתח הראשי של הטבלה. כך תוכלו לקשר את הממצאים לשורות בטבלה שמכילות אותם.
מזינים את שמות העמודות שמזהות באופן ייחודי כל שורה בטבלה. אם יש צורך, אפשר להשתמש בסימון נקודות כדי לציין שדות מקוננים. אפשר להוסיף כמה שדות שרוצים.
כדי לייצא את הממצאים ל-BigQuery, צריך גם להפעיל את הפעולה שמירה ב-BigQuery. כשמייצאים את הממצאים ל-BigQuery, כל ממצא מכיל את הערכים המתאימים של השדות המזהים. מידע נוסף זמין במאמר identifyingFields.
הגדרת זיהוי
בקטע הגדרת זיהוי מציינים את סוגי המידע האישי הרגיש שרוצים לסרוק. השלמת הקטע הזה היא אופציונלית. אם מדלגים על הקטע הזה, Sensitive Data Protection יסרוק את הנתונים שלכם כדי למצוא קבוצת ברירת מחדל של infoTypes.
תבנית
אפשר גם להשתמש בתבנית של Sensitive Data Protection כדי לעשות שימוש חוזר בפרטי ההגדרה שציינתם בעבר.
אם כבר יצרתם תבנית שבה אתם רוצים להשתמש, לוחצים על השדה שם התבנית כדי לראות רשימה של תבניות בדיקה קיימות. בוחרים או מקלידים את שם התבנית שבה רוצים להשתמש.
מידע נוסף על יצירת תבניות זמין במאמר יצירת תבניות לבדיקת Sensitive Data Protection.
InfoTypes
גלאי InfoType מוצאים מידע אישי רגיש מסוג מסוים. לדוגמה, US_SOCIAL_SECURITY_NUMBERגלאי ה-infoType המובנה של Sensitive Data Protection
מוצא מספרי ביטוח לאומי בארה"ב. בנוסף לגלאי סוגי המידע המובנים, אתם יכולים ליצור גלאי סוגי מידע בהתאמה אישית.
בקטע InfoTypes, בוחרים את אמצעי הזיהוי של סוג המידע שמתאים לסוג הנתונים שרוצים לסרוק. אפשר גם להשאיר את השדה הזה ריק כדי לסרוק את כל סוגי המידע שמוגדרים כברירת מחדל. מידע נוסף על כל גלאי זמין במאמר בנושא גלאי Infotype.
אפשר גם להוסיף גלאים מותאמים אישית של סוגי מידע בקטע Custom infoTypes, ולהתאים אישית גלאים מובנים וגלאים מותאמים אישית של סוגי מידע בקטע Inspection rulesets.
סוגי מידע בהתאמה אישית
כדי להוסיף סוגי מידע בהתאמה אישית, ראו הוספת סוגי מידע בהתאמה אישית.
ערכות כללים לבדיקה
ערכות כללים לבדיקה מאפשרות לכם להתאים אישית גלאים מובנים וגלאים מותאמים אישית של infoType באמצעות כללי הקשר. סוגי כללי הבדיקה הם:
- כללי החרגה, שעוזרים להחריג ממצאים שגויים או לא רצויים.
- כללים למילות הפעלה, שעוזרים לזהות ממצאים נוספים.
- כללי התאמה, שמתאימים את הסבירות לממצאים על סמך ההקשר שבו הם מופיעים.
כדי להוסיף קבוצת כללים חדשה, קודם צריך לציין גלאי infoType מובנה או מותאם אישית אחד או יותר בקטע InfoTypes. בוחרים את כל הגלאים של סוגי המידע שערכות הכללים משנות (סוגי המידע שמוגדרים כיעד) או משמשים להערכה (סוגי המידע שמוגדרים כהקשר). לאחר מכן, מבצעים את הפעולות הבאות:
- לוחצים על הוספת קבוצת כללים.
- בשדה בחירת סוגי מידע לטירגוט, בוחרים את סוגי המידע שהכללים ישנו אם התנאים יתקיימו.
- לוחצים על הוספת כלל כדי לפתוח תפריט עם אפשרויות, כולל כלל מילת הפעלה, כלל החרגה וכלל התאמה.
כדי ליצור כלל למילת הפעלה, בוחרים באפשרות כלל למילת הפעלה. לאחר מכן, מבצעים את הפעולות הבאות:
- בשדה מילת הפעלה מזינים ביטוי רגולרי ש-Sensitive Data Protection מחפש.
- בתפריט קרבה למילת ההפעלה, בוחרים אם מילת ההפעלה שהזנתם נמצאת לפני או אחרי סוג המידע שנבחר.
- בקטע Hotword distance from infoType (מרחק מילת החיפוש מסוג המידע), מזינים את מספר התווים המשוער בין מילת החיפוש לבין סוג המידע שנבחר.
- בקטע התאמה של רמת הסמך, בוחרים אם להקצות להתאמות רמת סבירות קבועה, או להגדיל או להקטין את רמת הסבירות שמוגדרת כברירת מחדל בסכום מסוים.
כדי ליצור כלל החרגה, בוחרים באפשרות כלל החרגה ואת סוג כלל ההחרגה שרוצים ליצור, למשל ביטוי רגולרי. לאחר מכן, מבצעים את הפעולות הבאות:
- בהתאם לסוג כלל ההחרגה שבחרתם, מזינים את הביטוי הרגולרי, את הניסוח, את מילת ההפעלה או את סוג המידע של ההקשר שצריך למצוא כדי שהכלל יחול.
- בהתאם לסוג כלל ההחרגה שבחרתם, מגדירים את סוג ההתאמה או את סוג ההכלה של התמונה:
- אם בחרתם כלל החרגה מבוסס-טקסט, בוחרים באחד מסוגי ההתאמה הבאים:
- התאמה מלאה: הממצא חייב להיות זהה לחלוטין לטקסט או למידע על סוג ההקשר שסיפקתם.
- התאמה חלקית: מחרוזת משנה בתוצאת החיפוש צריכה להיות זהה לטקסט או למידע על סוג ההקשר שסיפקתם.
- התאמה הפוכה: הממצא לא יכול להיות זהה לטקסט או למידע על סוג המידע שסיפקתם.
- אם בחרתם כלל החרגה שמבוסס על תמונה, בוחרים את היחס המרחבי הנדרש בין סוגי המידע של היעד וההקשר. לדוגמה, אם בוחרים באפשרות Encloses (מכיל), הממצא של ההקשר צריך להכיל את ממצא היעד כדי שהכלל יחול.
כדי ליצור כלל התאמה, בוחרים באפשרות כלל התאמה ואת סוג כלל ההתאמה, לדוגמה, התאמה לפי ממצאי תמונות. לאחר מכן, מבצעים את הפעולות הבאות:
- בשדה Context infoTypes, בוחרים את הגלאים של סוגי המידע שמספקים הקשר לתוצאת החיפוש. Sensitive Data Protection משתמש ב-infoTypes של הקשר כדי להעריך אם צריך לשנות את infoType היעד.
- בשדה Minimum likelihood, בוחרים את רמת הסבירות הנמוכה ביותר שסוגי המידע של ההקשר יכולים לקבל ועדיין להפעיל את כלל ההתאמה. אם ערך הסבירות של כל ממצא של הקשר שזוהה נמוך מהערך הזה, Sensitive Data Protection לא משנה את הסבירות של ממצא היעד.
- בממצאים שקשורים לתמונות, בשדה סוג ההכלה של התמונה, בוחרים את היחס המרחבי הנדרש בין סוגי המידע של היעד וההקשר. לדוגמה, אם בוחרים באפשרות Encloses (מכיל), המערכת תחיל את הכלל רק אם הממצא בהקשר מכיל את ממצא היעד.
- בשדה סבירות, בוחרים את רמת הסבירות החדשה שרוצים להקצות לממצא היעד.
אפשר להוסיף עוד קבוצות כללים כדי לשפר את תוצאות הסריקה.
סף ביטחון
בכל פעם ש-Sensitive Data Protection מזהה התאמה פוטנציאלית למידע אישי רגיש, הוא מקצה לו ערך הסתברות בסולם שנע בין 'מאוד לא סביר' ל'מאוד סביר'. כשמגדירים כאן ערך סבירות, נותנים ל-Sensitive Data Protection הוראה להתאים רק נתונים שערך הסבירות שלהם שווה לערך הזה או גבוה ממנו.
ערך ברירת המחדל 'אפשרי' מספיק לרוב המטרות. אם אתם מקבלים באופן קבוע התאמות רחבות מדי, כדאי להזיז את פס ההזזה למעלה. אם מקבלים מעט מדי התאמות, מזיזים את פס ההזזה למטה.
בסיום, לוחצים על המשך.
הוספת פעולות
בקטע Add actions (הוספת פעולות), בוחרים פעולה אחת או יותר שרוצים שמערכת Sensitive Data Protection תבצע אחרי שהעבודה תסתיים. מידע נוסף זמין במאמר בנושא הפעלת פעולות של בדיקה או ניתוח סיכונים.
אחרי שבוחרים פעולות, לוחצים על המשך.
לוח זמנים
בקטע Schedule (תזמון), אפשר לבצע שתי פעולות:
- ציון טווח זמן: האפשרות הזו מגבילה את הקבצים או השורות לסריקה לפי תאריך. לוחצים על שעת התחלה כדי לציין את חותמת הזמן המוקדמת ביותר של הקובץ שרוצים לכלול. כדי לציין את כל הקבצים, משאירים את הערך הזה ריק. לוחצים על שעת סיום כדי לציין את חותמת הזמן האחרונה של הקובץ שרוצים לכלול. כדי שלא תהיה מגבלה עליונה על חותמת הזמן, צריך להשאיר את הערך הזה ריק.
יצירת טריגר להרצת העבודה לפי לוח זמנים תקופתי: האפשרות הזו הופכת את העבודה לטריגר עבודה שפועל לפי לוח זמנים תקופתי. אם לא מציינים לוח זמנים, יוצרים בפועל משימה אחת שמתחילה מיד ופועלת פעם אחת. כדי ליצור טריגר של משימה שמופעל באופן קבוע, צריך להגדיר את האפשרות הזו.
ערך ברירת המחדל הוא גם הערך המינימלי: 24 שעות. הערך המקסימלי הוא 60 ימים.
אם רוצים ש-Sensitive Data Protection יסרוק רק קבצים או שורות חדשים, בוחרים באפשרות Limit scans only to new content. בבדיקה של BigQuery, רק שורות שהגיל שלהן הוא לפחות שלוש שעות נכללות בסריקה. אפשר לעיין בבעיה הידועה שקשורה לפעולה הזו.
בדיקה
בקטע Review (בדיקה) מופיע סיכום של הגדרות העבודה שציינתם, בפורמט JSON.
לוחצים על Create (יצירה) כדי ליצור את טריגר העבודה (אם ציינתם לוח זמנים). מופיע דף המידע של טריגר העבודה, שכולל את הסטטוס ומידע נוסף. אם העבודה פועלת כרגע, אפשר ללחוץ על הלחצן ביטול כדי לעצור אותה. אפשר גם למחוק את הטריגר של העבודה בלחיצה על מחיקה.
כדי לחזור לדף הראשי של Sensitive Data Protection, לוחצים על החץ חזרה במסוף Google Cloud .
C#
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Go
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Java
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Node.js
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
PHP
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Python
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
REST
טריגר של עבודת DLP מיוצג ב-DLP API על ידי המשאב JobTrigger. אפשר ליצור טריגר חדש של משימה באמצעות method projects.jobTriggers.create של המשאב JobTrigger.
אפשר לשלוח את ה-JSON לדוגמה הזה בבקשת POST לנקודת הקצה שצוינה של REST של Sensitive Data Protection. בדוגמה הבאה של JSON אפשר לראות איך ליצור טריגר להפעלת עבודה ב-Sensitive Data Protection. המשימה שהטריגר הזה יפעיל היא סריקה של Datastore. הטריגר של המשימה שנוצר פועל כל 86,400 שניות (או 24 שעות).
כדי לנסות את זה במהירות, אפשר להשתמש ב-API Explorer שמוטמע בהמשך. חשוב לזכור שבקשה מוצלחת, גם כזו שנוצרה ב-API Explorer, תיצור טריגר חדש של משימה מתוזמנת. מידע כללי על שימוש ב-JSON כדי לשלוח בקשות ל-DLP API זמין במדריך לתחילת העבודה עם JSON.
קלט JSON:
{
"jobTrigger":{
"displayName":"JobTrigger1",
"description":"Starts an inspection of a Datastore kind",
"triggers":[
{
"schedule":{
"recurrencePeriodDuration":"86400s"
}
}
],
"status":"HEALTHY",
"inspectJob":{
"storageConfig":{
"datastoreOptions":{
"kind":{
"name":"Example-Kind"
},
"partitionId":{
"projectId":"[PROJECT_ID]",
"namespaceId":"[NAMESPACE_ID]"
}
}
},
"inspectConfig":{
"infoTypes":[
{
"name":"PHONE_NUMBER"
}
],
"excludeInfoTypes":false,
"includeQuote":true,
"minLikelihood":"LIKELY"
},
"actions":[
{
"saveFindings":{
"outputConfig":{
"table":{
"projectId":"[PROJECT_ID]",
"datasetId":"[BIGQUERY_DATASET_NAME]",
"tableId":"[BIGQUERY_TABLE_NAME]"
}
}
}
}
]
}
}
}
פלט JSON:
הפלט הבא מצביע על כך שהטריגר של העבודה נוצר בהצלחה.
{
"name":"projects/[PROJECT_ID]/jobTriggers/[JOB_TRIGGER_NAME]",
"displayName":"JobTrigger1",
"description":"Starts an inspection of a Datastore kind",
"inspectJob":{
"storageConfig":{
"datastoreOptions":{
"partitionId":{
"projectId":"[PROJECT_ID]",
"namespaceId":"[NAMESPACE_ID]"
},
"kind":{
"name":"Example-Kind"
}
}
},
"inspectConfig":{
"infoTypes":[
{
"name":"PHONE_NUMBER"
}
],
"minLikelihood":"LIKELY",
"limits":{
},
"includeQuote":true
},
"actions":[
{
"saveFindings":{
"outputConfig":{
"table":{
"projectId":"[PROJECT_ID]",
"datasetId":"[BIGQUERY_DATASET_NAME]",
"tableId":"[BIGQUERY_TABLE_NAME]"
}
}
}
}
]
},
"triggers":[
{
"schedule":{
"recurrencePeriodDuration":"86400s"
}
}
],
"createTime":"2018-11-30T01:52:41.171857Z",
"updateTime":"2018-11-30T01:52:41.171857Z",
"status":"HEALTHY"
}
הצגת רשימה של כל המשרות
כדי להציג רשימה של כל המשימות בפרויקט הנוכחי:
המסוף
נכנסים לדף Sensitive Data Protection במסוף Google Cloud .
לוחצים על הכרטיסייה בדיקה ואז על כרטיסיית המשנה בדיקת משימות.
במסוף מוצגת רשימה של כל העבודות בפרויקט הנוכחי, כולל מזהי העבודות, המצב, זמן היצירה וזמן הסיום. כדי לקבל מידע נוסף על עבודה מסוימת, כולל סיכום של התוצאות שלה, לוחצים על המזהה שלה.
C#
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Go
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Java
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Node.js
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
PHP
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Python
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
REST
למשאב DlpJob יש method projects.dlpJobs.list שבאמצעותה אפשר לפרט את כל העבודות.
כדי להציג רשימה של כל המשימות שמוגדרות כרגע בפרויקט, שולחים בקשת GET לנקודת הקצה dlpJobs, כמו בדוגמה הבאה:
כתובת ה-URL:
GET https://dlp.googleapis.com/v2/projects/[PROJECT-ID]/dlpJobs?key={YOUR_API_KEY}
פלט ה-JSON הבא מציג אחת מהמשימות שהוחזרו. שימו לב שהמבנה של המשימה זהה למבנה של משאב DlpJob.
פלט JSON:
{
"jobs":[
{
"name":"projects/[PROJECT-ID]/dlpJobs/i-5270277269264714623",
"type":"INSPECT_JOB",
"state":"DONE",
"inspectDetails":{
"requestedOptions":{
"snapshotInspectTemplate":{
},
"jobConfig":{
"storageConfig":{
"cloudStorageOptions":{
"fileSet":{
"url":"[CLOUD-STORAGE-URL]"
},
"fileTypes":[
"FILE_TYPE_UNSPECIFIED"
],
"filesLimitPercent":100
},
"timespanConfig":{
"startTime":"2019-09-08T22:43:16.623Z",
"enableAutoPopulationOfTimespanConfig":true
}
},
"inspectConfig":{
"infoTypes":[
{
"name":"US_SOCIAL_SECURITY_NUMBER"
},
{
"name":"CANADA_SOCIAL_INSURANCE_NUMBER"
}
],
"minLikelihood":"LIKELY",
"limits":{
},
"includeQuote":true
},
"actions":[
{
"saveFindings":{
"outputConfig":{
"table":{
"projectId":"[PROJECT-ID]",
"datasetId":"[DATASET-ID]",
"tableId":"[TABLE-ID]"
}
}
}
}
]
}
},
"result":{
...
}
},
"createTime":"2019-09-09T22:43:16.918Z",
"startTime":"2019-09-09T22:43:16.918Z",
"endTime":"2019-09-09T22:43:53.091Z",
"jobTriggerName":"projects/[PROJECT-ID]/jobTriggers/sample-trigger2"
},
...
כדי לנסות את זה במהירות, אפשר להשתמש ב-API Explorer שמוטמע בהמשך. מידע כללי על שימוש ב-JSON כדי לשלוח בקשות ל-DLP API זמין במדריך לתחילת העבודה עם JSON.
הצגת רשימה של כל הגורמים להפעלת משימות
כדי להציג רשימה של כל הגורמים המפעילים של המשימות בפרויקט הנוכחי:
המסוף
נכנסים לדף Sensitive Data Protection במסוף Google Cloud .
מעבר אל Sensitive Data Protection
בכרטיסייה בדיקה, בכרטיסיית המשנה טריגרים של משימות, מוצגת במסוף רשימה של כל הטריגרים של המשימות בפרויקט הנוכחי.
C#
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Go
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Java
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Node.js
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
PHP
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Python
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
REST
למשאב JobTrigger יש method projects.jobTriggers.list שבאמצעותה אפשר לפרט את כל הטריגרים של העבודות.
כדי להציג ברשימה את כל טריגרי ההפעלה של המשימות שהוגדרו כרגע בפרויקט, שולחים בקשת GET לנקודת הקצה jobTriggers, כמו בדוגמה הבאה:
כתובת ה-URL:
GET https://dlp.googleapis.com/v2/projects/[PROJECT-ID]/jobTriggers?key={YOUR_API_KEY}
פלט ה-JSON הבא מפרט את טריגר העבודה שיצרנו בקטע הקודם. שימו לב שהמבנה של הטריגר של המשימה זהה למבנה של משאב JobTrigger.
פלט JSON:
{
"jobTriggers":[
{
"name":"projects/[PROJECT_ID]/jobTriggers/[JOB_TRIGGER_NAME]",
"displayName":"JobTrigger1",
"description":"Starts an inspection of a Datastore kind",
"inspectJob":{
"storageConfig":{
"datastoreOptions":{
"partitionId":{
"projectId":"[PROJECT_ID]",
"namespaceId":"[NAMESPACE_ID]"
},
"kind":{
"name":"Example-Kind"
}
}
},
"inspectConfig":{
"infoTypes":[
{
"name":"PHONE_NUMBER"
}
],
"minLikelihood":"LIKELY",
"limits":{
},
"includeQuote":true
},
"actions":[
{
"saveFindings":{
"outputConfig":{
"table":{
"projectId":"[PROJECT_ID]",
"datasetId":"[BIGQUERY_DATASET_NAME]",
"tableId":"[BIGQUERY_TABLE_NAME]"
}
}
}
}
]
},
"triggers":[
{
"schedule":{
"recurrencePeriodDuration":"86400s"
}
}
],
"createTime":"2018-11-30T01:52:41.171857Z",
"updateTime":"2018-11-30T01:52:41.171857Z",
"status":"HEALTHY"
},
...
],
"nextPageToken":"KkwKCQjivJ2UpPreAgo_Kj1wcm9qZWN0cy92ZWx2ZXR5LXN0dWR5LTE5NjEwMS9qb2JUcmlnZ2Vycy8xNTA5NzEyOTczMDI0MDc1NzY0"
}
כדי לנסות את זה במהירות, אפשר להשתמש ב-API Explorer שמוטמע בהמשך. מידע כללי על שימוש ב-JSON כדי לשלוח בקשות ל-DLP API זמין במדריך לתחילת העבודה עם JSON.
מחיקת משימה
כדי למחוק משימה מהפרויקט, כולל התוצאות שלה, פועלים לפי השלבים הבאים. הפעולה הזו לא משפיעה על תוצאות שנשמרו באופן חיצוני (למשל ב-BigQuery).
המסוף
נכנסים לדף Sensitive Data Protection במסוף Google Cloud .
לוחצים על הכרטיסייה בדיקה ואז על כרטיסיית המשנה בדיקת משימות. במסוף Google Cloud מוצגת רשימה של כל המשימות בפרויקט הנוכחי.
בעמודה פעולות של טריגר העבודה שרוצים למחוק, לוחצים על תפריט הפעולות הנוספות (שמוצג כ-3 נקודות אנכיות) ואז על מחיקה.
אפשרות נוספת: ברשימת המשרות, לוחצים על המזהה של המשרה שרוצים למחוק. בדף הפרטים של המשרה, לוחצים על מחיקה.
C#
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Go
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Java
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Node.js
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
PHP
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Python
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
REST
כדי למחוק משימה מהפרויקט הנוכחי, שולחים בקשת DELETE לנקודת הקצה dlpJobs, כמו שמוצג כאן. מחליפים את השדה [JOB-IDENTIFIER] במזהה של המשרה, שמתחיל ב-i-.
כתובת ה-URL:
DELETE https://dlp.googleapis.com/v2/projects/[PROJECT-ID]/dlpJobs/[JOB-IDENTIFIER]?key={YOUR_API_KEY}
אם הבקשה מצליחה, DLP API מחזיר תגובה של הצלחה. כדי לוודא שהמשימה נמחקה, מציגים רשימה של כל המשימות.
כדי לנסות את זה במהירות, אפשר להשתמש ב-API Explorer שמוטמע בהמשך. מידע כללי על שימוש ב-JSON כדי לשלוח בקשות ל-DLP API זמין במדריך לתחילת העבודה עם JSON.
מחיקה של טריגר למשרה
המסוף
נכנסים לדף Sensitive Data Protection במסוף Google Cloud .
מעבר אל Sensitive Data Protection
בכרטיסייה Inspection, בכרטיסיית המשנה Job triggers, מוצגת במסוף רשימה של כל טריגרי ההפעלה של המשימות בפרויקט הנוכחי.
בעמודה פעולות של טריגר העבודה שרוצים למחוק, לוחצים על תפריט הפעולות הנוספות (שמוצג כ-3 נקודות אנכיות) ואז על מחיקה.
אפשרות אחרת: ברשימת טריגרים של משימות, לוחצים על השם של הטריגר שרוצים למחוק. בדף הפרטים של טריגר המשימה, לוחצים על מחיקה.
C#
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Go
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Java
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Node.js
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
PHP
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Python
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
REST
כדי למחוק טריגר להפעלת משימה מהפרויקט הנוכחי, שולחים בקשת DELETE לנקודת הקצה jobTriggers, כמו שמוצג כאן. מחליפים את השדה [JOB-TRIGGER-NAME] בשם של טריגר העבודה.
כתובת ה-URL:
DELETE https://dlp.googleapis.com/v2/projects/[PROJECT-ID]/jobTriggers/[JOB-TRIGGER-NAME]?key={YOUR_API_KEY}
אם הבקשה מצליחה, DLP API מחזיר תגובה של הצלחה. כדי לוודא שהטריגר של העבודה נמחק בהצלחה, מציגים רשימה של כל הטריגרים של העבודות.
כדי לנסות את זה במהירות, אפשר להשתמש ב-API Explorer שמוטמע בהמשך. מידע כללי על שימוש ב-JSON כדי לשלוח בקשות ל-DLP API זמין במדריך לתחילת העבודה עם JSON.
חיפוש עבודה
כדי לקבל משימה מהפרויקט, כולל התוצאות שלה, פועלים לפי השלבים הבאים. הפעולה הזו לא משפיעה על תוצאות שנשמרו באופן חיצוני (למשל ב-BigQuery).
C#
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Go
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Java
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Node.js
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
PHP
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Python
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
REST
כדי לקבל עבודה מהפרויקט הנוכחי, שולחים בקשת GET לנקודת הקצה dlpJobs, כמו בדוגמה הבאה. מחליפים את השדה [JOB-IDENTIFIER] במזהה של המשרה, שמתחיל ב-i-.
כתובת ה-URL:
GET https://dlp.googleapis.com/v2/projects/[PROJECT-ID]/dlpJobs/[JOB-IDENTIFIER]?key={YOUR_API_KEY}
אם הבקשה מצליחה, DLP API מחזיר תגובה של הצלחה.
כדי לנסות את זה במהירות, אפשר להשתמש ב-API Explorer שמוטמע בהמשך. מידע כללי על שימוש ב-JSON כדי לשלוח בקשות ל-DLP API זמין במדריך לתחילת העבודה עם JSON.
הפעלת טריגר של משימה באופן מיידי
אחרי שיוצרים טריגר להפעלת משימה, אפשר להפעיל אותו כדי לבדוק אותו ולהריץ אותו באופן מיידי. כדי לעשות זאת, מריצים את הפקודה הבאה:
curl --request POST \
-H "Content-Type: application/json" \
-H "Accept: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "X-Goog-User-Project: PROJECT_ID" \
'https://dlp.googleapis.com/v2/JOB_TRIGGER_NAME:activate'
מחליפים את מה שכתוב בשדות הבאים:
- PROJECT_ID: מזהה הפרויקט Google Cloudשאליו יחויבו עלויות הגישה שמשויכות לבקשה.
- JOB_TRIGGER_NAME: שם המשאב המלא של טריגר העבודה, לדוגמה,
projects/my-project/locations/global/jobTriggers/123456789.
עדכון של טריגר קיים של משימה
בנוסף ליצירה, לפירוט ולמחיקה של טריגרים של משימות, אפשר גם לעדכן טריגר קיים של משימה. כדי לשנות את ההגדרה של טריגר קיים של משימה:
המסוף
נכנסים לדף Sensitive Data Protection במסוף Google Cloud .
לוחצים על הכרטיסייה בדיקה ואז על כרטיסיית המשנה טריגרים של משימות.
במסוף מוצגת רשימה של כל הטריגרים של המשימות בפרויקט הנוכחי.
בעמודה פעולות של טריגר המשימה שרוצים למחוק, לוחצים על סמל האפשרויות הנוספות more_vert ואז על הצגת הפרטים.
בדף הפרטים של טריגר העבודה, לוחצים על עריכה.
בדף 'עריכת טריגר', אפשר לשנות את המיקום של נתוני הקלט, את פרטי הזיהוי כמו תבניות, סוגי מידע או סבירות, את הפעולות שאחרי הסריקה ואת לוח הזמנים של הטריגר של העבודה. כשמסיימים לבצע את השינויים, לוחצים על שמירה.
C#
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Go
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Java
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Node.js
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
PHP
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Python
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
REST
משתמשים בשיטה
projects.jobTriggers.patch
כדי לשלוח ערכים חדשים של JobTrigger ל-DLP API
כדי לעדכן את הערכים האלה בטריגר משימה שצוין.
לדוגמה, נניח שיש לכם את טריגר העבודה הפשוט הבא. קובץ ה-JSON הזה מייצג את טריגר העבודה, והוא הוחזר אחרי שליחת בקשת GET לנקודת הקצה של טריגר העבודה בפרויקט הנוכחי.
פלט JSON:
{
"name":"projects/[PROJECT_ID]/jobTriggers/[JOB_TRIGGER_NAME]",
"inspectJob":{
"storageConfig":{
"cloudStorageOptions":{
"fileSet":{
"url":"gs://dlptesting/*"
},
"fileTypes":[
"FILE_TYPE_UNSPECIFIED"
],
"filesLimitPercent":100
},
"timespanConfig":{
"enableAutoPopulationOfTimespanConfig":true
}
},
"inspectConfig":{
"infoTypes":[
{
"name":"US_SOCIAL_SECURITY_NUMBER"
}
],
"minLikelihood":"POSSIBLE",
"limits":{
}
},
"actions":[
{
"jobNotificationEmails":{
}
}
]
},
"triggers":[
{
"schedule":{
"recurrencePeriodDuration":"86400s"
}
}
],
"createTime":"2019-03-06T21:19:45.774841Z",
"updateTime":"2019-03-06T21:19:45.774841Z",
"status":"HEALTHY"
}
קובץ ה-JSON הבא, שנשלח עם בקשת PATCH לנקודת הקצה שצוינה,
מעדכן את טריגר המשרה שצוין עם infoType חדש לסריקה, וגם עם
סבירות מינימלית חדשה. חשוב לזכור שצריך לציין גם את מאפיין updateMask, ושערך המאפיין הזה צריך להיות בפורמט FieldMask.
קלט JSON:
PATCH https://dlp.googleapis.com/v2/projects/[PROJECT_ID]/jobTriggers/[JOB_TRIGGER_NAME]?key={YOUR_API_KEY}
{
"jobTrigger":{
"inspectJob":{
"inspectConfig":{
"infoTypes":[
{
"name":"US_INDIVIDUAL_TAXPAYER_IDENTIFICATION_NUMBER"
}
],
"minLikelihood":"LIKELY"
}
}
},
"updateMask":"inspectJob(inspectConfig(infoTypes,minLikelihood))"
}
אחרי ששולחים את ה-JSON הזה לכתובת ה-URL שצוינה, מוחזרת התוצאה הבאה, שמייצגת את טריגר העבודה המעודכן. שימו לב שהערכים המקוריים של infoType ושל הסבירות הוחלפו בערכים החדשים.
פלט JSON:
{
"name":"projects/[PROJECT_ID]/jobTriggers/[JOB_TRIGGER_NAME]",
"inspectJob":{
"storageConfig":{
"cloudStorageOptions":{
"fileSet":{
"url":"gs://dlptesting/*"
},
"fileTypes":[
"FILE_TYPE_UNSPECIFIED"
],
"filesLimitPercent":100
},
"timespanConfig":{
"enableAutoPopulationOfTimespanConfig":true
}
},
"inspectConfig":{
"infoTypes":[
{
"name":"US_INDIVIDUAL_TAXPAYER_IDENTIFICATION_NUMBER"
}
],
"minLikelihood":"LIKELY",
"limits":{
}
},
"actions":[
{
"jobNotificationEmails":{
}
}
]
},
"triggers":[
{
"schedule":{
"recurrencePeriodDuration":"86400s"
}
}
],
"createTime":"2019-03-06T21:19:45.774841Z",
"updateTime":"2019-03-06T21:27:01.650183Z",
"lastRunTime":"1970-01-01T00:00:00Z",
"status":"HEALTHY"
}
כדי לנסות את זה במהירות, אפשר להשתמש ב-API Explorer שמוטמע בהמשך. מידע כללי על שימוש ב-JSON כדי לשלוח בקשות ל-DLP API זמין במדריך לתחילת העבודה עם JSON.
זמן האחזור של המשימה
אין יעדים למדידת רמת השירות (SLO) שמובטחים לגבי משימות וטריגרים של משימות. ההשהיה מושפעת מכמה גורמים, כולל כמות הנתונים שצריך לסרוק, מאגר האחסון שנסרק, הסוג והמספר של סוגי המידע שאתם סורקים, האזור שבו העבודה מעובדת ומשאבי המחשוב שזמינים באזור הזה. לכן, אי אפשר לקבוע מראש את זמן האחזור של עבודות הבדיקה.
כדי לצמצם את זמן האחזור של העבודות, אפשר לנסות את הפעולות הבאות:
- אם האפשרות דגימה זמינה למשימה או לטריגר של המשימה, מפעילים אותה.
אל תפעילו סוגי מידע שאתם לא צריכים. למרות שהמידע הבא שימושי בתרחישים מסוימים, סוגי המידע האלה יכולים להאט משמעותית את הרצת הבקשות בהשוואה לבקשות שלא כוללות אותם:
PERSON_NAMEFEMALE_NAMEMALE_NAMEFIRST_NAMELAST_NAMEDATE_OF_BIRTHLOCATIONSTREET_ADDRESSORGANIZATION_NAME
תמיד צריך לציין במפורש את סוגי המידע. אל תשתמשו ברשימה ריקה של infoTypes.
אם אפשר, כדאי להשתמש באזור עיבוד אחר.
אם עדיין יש בעיות של זמן אחזור בעבודות אחרי שמנסים את הטכניקות האלה,
אפשר לשקול להשתמש בבקשות של
content.inspect או של
content.deidentify במקום בעבודות. השיטות האלה מכוסות בהסכם רמת השירות. מידע נוסף מופיע בהסכם רמת השירות (SLA) של שירות Sensitive Data Protection.
הגבלת הסריקות לתוכן חדש בלבד
אתם יכולים להגדיר את טריגר העבודה כך שיגדיר אוטומטית את טווח התאריכים של קבצים שמאוחסנים ב-Cloud Storage או ב-BigQuery. כשמגדירים את האובייקט TimespanConfig לאכלוס אוטומטי, Sensitive Data Protection סורקת רק נתונים שנוספו או שונו מאז ההפעלה האחרונה של הטריגר:
...
timespan_config {
enable_auto_population_of_timespan_config: true
}
...
בבדיקה של BigQuery נכללות רק שורות שנוצרו לפני שלוש שעות לפחות. אפשר לעיין בבעיה הידועה שקשורה לפעולה הזו.
הפעלת משימות בהעלאת קובץ
בנוסף לתמיכה בהפעלת עבודות – שמוטמעת ב-Sensitive Data Protection – ל-Google Cloud יש גם מגוון רכיבים אחרים שבהם אפשר להשתמש כדי לשלב או להפעיל עבודות של Sensitive Data Protection. לדוגמה, אתם יכולים להשתמש בפונקציות Cloud Run כדי להפעיל סריקה של Sensitive Data Protection בכל פעם שקובץ מועלה ל-Cloud Storage.
מידע על הגדרת הפעולה הזו מופיע במאמר אוטומציה של סיווג נתונים שהועלו ל-Cloud Storage.
משימות שהסתיימו בהצלחה ללא נתונים שנבדקו
העבודה יכולה להסתיים בהצלחה גם אם לא נסרקו נתונים. אלה כמה תרחישים לדוגמה שבהם זה יכול לקרות:
- המשימה מוגדרת לבדיקת נכס נתונים ספציפי, כמו קובץ, שקיים אבל ריק.
- העבודה מוגדרת לבדיקת נכס נתונים שלא קיים או שכבר לא קיים.
- העבודה מוגדרת לבדיקה של קטגוריה של Cloud Storage ריקה.
- העבודה מוגדרת לבדיקת מאגר, והסריקה הרקורסיבית מושבתת. ברמה העליונה, המאגר מכיל רק תיקיות, שמכילות את הקבצים.
- העבודה מוגדרת לבדיקה רק של סוג קובץ ספציפי בדלי, אבל בדלי אין קבצים מהסוג הזה.
- המשימה מוגדרת לבדיקת תוכן חדש בלבד, אבל לא היו עדכונים מאז ההפעלה האחרונה של המשימה.
במסוף Google Cloud , בשדה Bytes scanned בדף Job details, מצוין כמה נתונים נבדקו על ידי העבודה. ב-DLP API, השדה processedBytes מציין כמה נתונים נבדקו.