数据隐私与位置隐私保护技术解析
1. 数据隐私保护概述
近年来,个人信息隐私在数据管理和传播应用中备受关注。通常,数据以关系数据模型存储,每条记录包含身份属性、准身份属性和敏感属性。人们希望保护敏感信息不被未经授权的方通过直接披露或间接推断获取。例如,即使去除身份属性后发布微数据,由于准身份属性与外部知识的关联,仍可能泄露个人敏感信息。
为解决这一问题,提出了各种隐私保护机制,可分为两类:一类是提出隐私模型和原则,作为衡量原始数据集发布是否提供足够隐私保护的标准;另一类是探索能满足这些原则并最大化数据效用的数据转换技术。
2. 数据隐私保护技术
2.1 披露限制技术
在统计数据库框架下,为控制数据传播中的信息披露,提出了多种披露限制技术,可大致分为查询限制和数据扰动:
- 查询限制 :包括控制查询结果大小、限制连续查询答案的重叠、抑制小单元格以及审计查询以检查隐私泄露。
- 数据扰动 :如对数据进行采样、交换不同单元格的数据条目、向数据或查询结果添加噪声。
然而,这些技术无法同时满足提供高精度统计和防止个人信息完全或部分披露的要求,且基于扰动的技术通常会损害表的数据完整性。
2.2 微数据隐私保护
为发布涉及个人敏感信息的非聚合微数据,研究主要集中在确保对手无法根据发布的数据和背景知识准确推断个人的敏感信息。微数据中的记录可分为标识符属性(如社会安全号码,通常在发布时移除)、准标识符(QI)属性(如邮政编码、性别和出生日期,其组合可能识别个人)和敏感(SA)属性(如疾病,是需
超级会员免费看
订阅专栏 解锁全文

45

被折叠的 条评论
为什么被折叠?



