בדף הזה מפורטים כל המדדים שנאספים בפרופילי נתונים, ומוסבר מה כל אחד מהם אומר.
יש שלושה סוגים של פרופילי נתונים: פרופילי נתונים של פרויקטים, פרופילי נתונים של טבלאות ופרופילי נתונים של עמודות.
פרופילים של נתוני פרויקט
לכל פרופיל נתונים של פרויקט יש את השדות הבאים. הערכים בשדות האלה הם ערכים מצטברים שמבוססים על המשאבים שנוצרו בפרויקט.
תובנות
בפרופילים של נתוני פרויקט מוצגות התובנות הבאות:
- סיכון נתונים
- רמת הסיכון שמשויכת לנתונים במצב הנוכחי שלהם. מידע נוסף זמין במאמר רמות רגישות וסיכון נתונים.
- רגישות
- ציון שמציין את רמת הרגישות של הפרויקט הזה. מידע נוסף זמין במאמר בנושא רמות רגישות וסיכון נתונים.
מטא-נתונים
פרופילי נתונים של פרויקטים מספקים את המטא-נתונים הבאים:
- הפרופיל האחרון שנוצר
- התאריך והשעה שבהם הפרופיל נוצר לאחרונה.
- מזהה פרויקט
- מזהה הפרויקט שנוצר לו פרופיל.
- שם המשאב
- שם פרופיל הנתונים המוגדר במלואו.
- סטטוס
- סמל שמציין את הסטטוס של פעולת יצירת הפרופיל.
פרופילים של נתונים בטבלה
לכל פרופיל נתונים של טבלה יש את השדות הבאים:
תובנות
פרופילים של נתונים בטבלה מספקים את התובנות הבאות:
- סיכון נתונים
- רמת הסיכון שמשויכת לנתונים במצב הנוכחי שלהם. מידע נוסף זמין במאמר רמות רגישות וסיכון נתונים.
- רגישות
- ציון שמציין את רמת הרגישות של הטבלה הזו. מידע נוסף זמין במאמר בנושא רמות רגישות וסיכון נתונים.
מטא-נתונים
פרופילים של נתונים בטבלה מספקים את המטא-נתונים הבאים:
- מסד נתונים
- מסד הנתונים שמכיל את הטבלה שנוצר לה פרופיל. השדה הזה רלוונטי רק לגילוי של Cloud SQL.
- מזהה קבוצת נתונים
- המזהה של מערך הנתונים שמכיל את הטבלה הזו.
- הצפנה
- האם ההצפנה של הטבלה הזו מנוהלת על ידי Google או על ידי הארגון שלכם.
- שעת התפוגה
- אופציונלי. השעה שבה יפוג התוקף של הטבלה הזו.
- מספר העמודות שנכשלו
- מספר העמודות שדילגנו עליהן בטבלה הזו בגלל שגיאה.
- בדיקת תמונת מצב של ההגדרה
- תמונת מצב של תבנית הבדיקה שבה נעשה שימוש כשנוצר הפרופיל. מידע נוסף מופיע במאמר תמונות מצב של פרופיל נתונים.
- Instance
- המופע שמכיל את הטבלה שנוצר לה פרופיל. השדה הזה רלוונטי רק לגילוי של Cloud SQL.
- הפרופיל האחרון שנוצר
- התאריך והשעה שבהם הפרופיל נוצר לאחרונה.
- העדכון האחרון ב-BigQuery
- התאריך והשעה שבהם בוצע השינוי האחרון בטבלה הזו.
- מזהה פרויקט
- מזהה הפרויקט שמכיל את הטבלה הזו.
- גלוי לכולם
האם הטבלה הזו זמינה לכל המשתמשים או רק למשתמשים מסוימים.
- תוויות משאבים
תוויות שהיו לטבלה בזמן יצירת הפרופיל.
- תגי משאבים
תגים שהיו בטבלה בזמן יצירת הפרופיל.
- שם המשאב
השם המוגדר במלואו של פרופיל הנתונים.
- מספר השורות
מספר השורות בטבלה הזו כשהפרופיל נוצר.
- מספר העמודות שנסרקו
מספר העמודות שנוצר להן פרופיל בטבלה הזו.
- חשבון שירות
מספר חשבונות השירות עם הרשאות IAM לגישה לטבלה הזו.
- סטטוס
ציון אם הפרופיל נוצר בהצלחה.
- מזהה טבלה
המזהה של הטבלה.
- מועד היצירה של הטבלה
התאריך והשעה שבהם הטבלה נוצרה.
- גודל הטבלה
הגודל של הטבלה הזו כשהפרופיל נוצר.
- סוג
סוג הגילוי שבוצע.
פרופילים של נתוני עמודות
לכל פרופיל נתונים של עמודה יש את השדות הבאים:
תובנות
פרופילים של נתוני עמודות מספקים את התובנות הבאות:
- סיכון נתונים
- רמת הסיכון שמשויכת לנתונים במצב הנוכחי שלהם. מידע נוסף זמין במאמר רמות רגישות וסיכון נתונים.
- רגישות
- ציון שמציין את רמת הרגישות של העמודה הזו. מידע נוסף זמין במאמר רמות רגישות וסיכון נתונים.
- סוג המידע שחזוי
אם סוג מידע מובנה או סוג מידע מותאם אישית אחד בולט בבירור יותר מאחרים בעמודה, Sensitive Data Protection מגדיר את השדה הזה לסוג המידע הזה. בכל שאר המקרים, לא מוזן ערך בשדה הזה.
כדי לראות רשימה של כל סוגי המידע שזוהו בעמודה, מעיינים בשדה Other infoTypes.
בסריקה של Sensitive Data Protection מתבצע חיפוש רק של סוגי המידע שצוינו בתבנית הבדיקה. לכן, רק סוגי המידע האלה יכולים להופיע בשדה Predicted infoType. לדוגמה, אם העמודה מכילה כתובות אימייל, אבל לא כללתם את גלאי
EMAIL_ADDRESSinfoType בתבנית הבדיקה, השדה הזה לא מכילEMAIL_ADDRESS.אם נתוני העמודה תואמים בעיקר לכמה סוגי מידע קרובים ששייכים לאותה קטגוריה כללית, Sensitive Data Protection מגדיר את השדה הזה לסוג המידע הכללי יותר. לדוגמה, אם בעמודה יש בעיקר שילוב של infoTypes
PASSPORT,AUSTRALIA_PASSPORTו-CANADA_PASSPORT, השדה Predicted infoType מוגדר ל-PASSPORT. בשדה Other infoTypes מוצגים סוגי מידע ספציפיים יותר וההערכה לגבי השכיחות שלהם.- סוגי מידע אחרים
סוגי מידע שזוהו בעמודה, אבל האות שלהם לא מספיק חזק כדי להיחשב לסוג המידע החזוי של העמודה. איך רואים את סוג המידע החזוי?
בפרופילי נתונים שנוצרו אחרי 13 באוקטובר 2022, לכל infoType שמופיע בשדה הזה יש שכיחות משוערת. השכיחות המשוערת היא אחוז משוער של שורות שאינן null שבהן זוהה סוג המידע.
לדוגמה, נניח שיש לכם עמודה עם המדדים הבאים:
- סוג המידע החזוי:
FDA_CODE - סוגי מידע אחרים:
PERSON_NAME (2%),STREET_ADDRESS (1%)
בדוגמה הזו, יש אינדיקציה חזקה לכך שהעמודה מכילה קודי FDA. Sensitive Data Protection קבעה גם שכ-2% מהשורות שאינן ריקות בעמודה עשויות להכיל שמות של אנשים, ו-1% עשויות להכיל כתובות.
בסריקה של Sensitive Data Protection מתבצע חיפוש רק של סוגי המידע שצוינו בתבנית הבדיקה. לכן, רק סוגי המידע האלה יכולים להופיע בשדה סוגי מידע אחרים. לדוגמה, אם העמודה מכילה כתובות אימייל, אבל לא כללתם את
EMAIL_ADDRESSהכלי לזיהוי infoType בתבנית הבדיקה, השדה הזה לא יכילEMAIL_ADDRESS.- סוג המידע החזוי:
- שיעור הערכים הריקים המשוער
החלק היחסי המשוער של ערכי null בעמודה הזו, שמסווגים כגבוה, בינוני, נמוך או נמוך מאוד. הערך הזה גבוה אם חלק גדול מהערכים בעמודה הזו הוא null.
- ייחודיות משוערת
הערכה של כמות הנתונים הייחודיים בעמודה הזו, שמסווגת כגבוהה, בינונית או נמוכה. רמת ייחודיות גבוהה מצביעה על כך שהעמודה מכילה ערכים שונים. נוכחות גבוהה של ערכים ייחודיים יכולה להצביע על כך שהעמודה מכילה מזהים.
רמת ייחודיות נמוכה מצביעה על כך שהעמודה מכילה הרבה ערכים נפוצים, כמו ערכי enum או ערכים בוליאניים.
אם Sensitive Data Protection קובע שאין מספיק שורות בטבלה כדי לחשב את המדד הזה, הערך הזה יהיה ריק.
- ציון טקסט חופשי
ההסתברות שהעמודה הזו מכילה טקסט חופשי. ערך שקרוב ל-1 מציין שהעמודה כנראה מכילה טקסט חופשי או טקסט בשפה טבעית. הערכים האפשריים הם בין 0 ל-1.
ציון גבוה של טקסט חופשי יכול להעלות את רמות הסיכון והרגישות של הנתונים בעמודה.
מטא-נתונים
פרופילים של נתוני עמודות מספקים את המטא-נתונים הבאים:
- מסד נתונים
- מסד הנתונים שמכיל את עמודת הטבלה שנוצר לה פרופיל. השדה הזה רלוונטי רק לגילוי של Cloud SQL.
- סוג נתונים
- סוג הנתונים של התוכן בעמודה הזו.
- מזהה קבוצת נתונים
- המזהה של מערך הנתונים שמכיל את עמודת הטבלה הזו.
- מזהה השדה
- שם העמודה.
- Instance
- המופע שמכיל את עמודת הטבלה שנוצר לה פרופיל. השדה הזה רלוונטי רק לגילוי של Cloud SQL.
- מיקום המכונה
- המיקום של המופע שמכיל את עמודת הטבלה שנוצר לה פרופיל. השדה הזה רלוונטי רק לגילוי של Cloud SQL.
- הפרופיל האחרון שנוצר
- התאריך והשעה שבהם הפרופיל נוצר לאחרונה.
- תגי מדיניות
- מציין אם תג מדיניות חל על העמודה. מידע על שיטות מומלצות לשימוש בתגי מדיניות זמין במאמר שימוש בתגי מדיניות ב-BigQuery.
- מזהה פרויקט
- המזהה של הפרויקט שמכיל את עמודת הטבלה הזו.
- שם המשאב
- שם פרופיל הנתונים המוגדר במלואו.
- סטטוס
- סמל שמציין את הסטטוס של פעולת יצירת הפרופיל.
- מזהה טבלה
- ID של הטבלה שמכילה את העמודה הזו.
פרופילי נתונים של מאגר קבצים
ב-Sensitive Data Protection, המונח file store מתייחס לקטגוריה או למאגר של אחסון קבצים.
כל פרופיל נתונים של מאגר קבצים כולל את השדות הבאים.
תובנות
פרופילים של נתוני חנות קבצים מספקים את התובנות הבאות:
- סיכון נתונים
- רמת הסיכון שמשויכת לנתונים במצב הנוכחי שלהם. מידע נוסף זמין במאמר רמות רגישות וסיכון נתונים.
- אשכולות קבצים
- מספק סיכום לכל אשכול קבצים שזוהה כשנוצר פרופיל של מאגר הקבצים הזה. מידע נוסף על כל סיכום זמין בקטע סיכומים של קבוצות קבצים שבדף הזה.
- רגישות
- ציון שמציין את רמת הרגישות של מאגר הקבצים הזה. מידע נוסף זמין במאמר בנושא רמות רגישות וסיכון נתונים.
מטא-נתונים
פרופילים של נתונים בחנות קבצים מספקים את המטא-נתונים הבאים:
- מיקומי אחסון הנתונים
אם יצרתם פרופיל של קטגוריה של Cloud Storage בשני אזורים, בשדה הזה מופיעים שני האזורים.
אם יצרתם פרופיל של מאגר קבצים מספק שירותי ענן אחר, הערך הזה הוא האזור שבו ספק שירותי הענן מאחסן את מאגר הקבצים.
- הצפנה
האם ההצפנה של מאגר הקבצים הזה מנוהלת על ידי Google או על ידי הארגון שלכם.
- סוג מאגר קבצים
המקור של הנתונים שנוצר להם פרופיל – Cloud Storage, Amazon S3 או Azure Blob Storage.
- נתיב מאגר הקבצים
השם של מאגר הקבצים.
- בדיקת תמונת מצב של ההגדרה
תמונת מצב של תבנית הבדיקה שבה נעשה שימוש כשנוצר הפרופיל. מידע נוסף מופיע במאמר בנושא תמונות מצב של פרופיל הנתונים.
- סוג מיקום
סוג המיקום שבו מאוחסן מאגר הקבצים:
region,dual-regionאוmulti-region.- התאריך שבו הפרופיל נוצר
התאריך והשעה שבהם הפרופיל נוצר בפעם הראשונה.
- הפרופיל נוצר לאחרונה
התאריך והשעה שבהם הפרופיל נוצר לאחרונה.
- מזהה ההורה
המשאב שבבעלותו הנתונים שנוצר להם פרופיל.
- אם פרופיל הנתונים הוא של משאב Google Cloud , זהו מזהה הפרויקט שמכיל את הנתונים.
- אם פרופיל הנתונים הוא של קטגוריה ב-Amazon S3, זהו המזהה של חשבון AWS שמכיל את הקטגוריה.
- אם פרופיל הנתונים הוא של מאגר Azure Blob Storage, זהו מזהה המינוי ל-Azure שמכיל את המאגר.
- גלוי לכולם
האם מאגר הקבצים הזה זמין לכל המשתמשים או מוגבל למשתמשים מסוימים.
- תוויות משאבים
התוויות שהיו במאגר הקבצים בזמן יצירת הפרופיל.
- תגי משאבים
תגים שהיו במאגר הקבצים בזמן יצירת הפרופיל.
- מיקום המשאב
אזור או מספר אזורים שמכילים את מאגר הקבצים.
אם יצרתם פרופיל של קטגוריה של Cloud Storage בשני אזורים, הערך הזה תלוי בשאלה אם הקטגוריה מאוחסנת בשני אזורים מוגדרים מראש:
- בצמד מוגדר מראש של שני אזורים, המערכת של Sensitive Data Protection מגדירה את הערך הזה לשם הצמד שמוגדר מראש של שני אזורים.
- במיקומים סטנדרטיים בשני אזורים, המערכת של Sensitive Data Protection מגדירה את הערך הזה למספר האזורים שמכילים את שני האזורים. מידע על המיפוי של אזורים לאזורים מרובים זמין במאמר בנושא צמדים של שני אזורים.
- שם המשאב
השם המוגדר במלואו של פרופיל הנתונים.
- סטטוס
ציון אם הפרופיל נוצר בהצלחה.
סיכומים של קבוצות קבצים
כשיוצרים פרופיל נתונים של מאגר קבצים, הקבצים מקובצים לאשכולות קבצים. Sensitive Data Protection מספק סיכום לכל אשכול קבצים.
כל סיכום של קבוצת קבצים כולל את השדות הבאים:
- סיכון נתונים
- רמת הסיכון שמשויכת לנתונים באשכול הקבצים הזה. מידע נוסף זמין במאמר רמות רגישות וסיכון נתונים.
- שגיאות
- כל השגיאות שזוהו כשנוצר פרופיל הנתונים של מאגר הקבצים.
- סיומות הקבצים שנסרקו
- רשימה של סוגי הקבצים שזוהו ונסרקו כדי ליצור את פרופיל נתוני מאגר הקבצים.
- סיומות קבצים שנצפו
- רשימה של סוגי קבצים שזוהו אבל לא נסרקו בהכרח.
- InfoTypes
- רשימה של סוגי מידע מוכללים ובהתאמה אישית שזוהו באשכול הקבצים הזה.
- רגישות
- ציון שמציין את רמת הרגישות של אשכול הקבצים הזה. מידע נוסף מופיע במאמר בנושא רמות רגישות וסיכון נתונים.
- סוג
מציין את קטגוריית הקבצים באשכול הזה. מידע נוסף על כל אשכולות הקבצים הנתמכים זמין במאמר בנושא אשכולות קבצים נתמכים בפעולות גילוי.