糖糖|隐私计算技术的三大主流门派( 八 )
会员注册信息表

文章图片
去标识符处理的医疗信息表
第二张医疗信息表中 , 虽然已经把用户姓名 , 身份证号等个人关联信息抹去 , 但如果直接发布这样简单匿名处理的数据 , 同样会带来数据泄露的风险 。 因为通过两张不同数据来源的表进行关联 , 对出生日期 , 性别 , 邮编的值进行匹配 , 可以定位出张三患有心脏病的隐私数据 。 这种通过某些属性与外部表链接的攻击称为链接攻击 。
如上图两个表所示 , 每一行代表用户的一条记录 , 每一列表示一个属性 。 每一个记录与一个特定的用户/个体关联 , 这些属性可以分为三类:
标识符(ExplicitIdentifier):可以直接确定一个个体 , 如:身份证号 , 姓名等 。
准标识符集(Quasi-identifierAttributeset):可以和外部表链接来识别个体的最小属性集 , 如:邮编 , 生日 , 性别等
敏感数据(SensitiveAttributes):用户不希望被人知道的数据 , 如:薪水 , 疾病历史 , 购买偏好等 。
K-匿名(K-Anonymity)是Samarati和Sweeney在1998年提出的技术 , 该技术可以保证存储在发布数据集中的每条个体记录对于敏感属性不能与其他的K-1个个体相区分 , 即K-匿名机制要求同一个准标识符至少要有K条记录 , 因此观察者无法通过准标识符连接记录 。
K-匿名的具体使用如下:隐私数据脱敏的第一步通常是对所有标识符列进行移除或是脱敏处理 , 使得攻击者无法直接标识用户 。 但是攻击者还是有可能通过多个准标识列的属性值识别到个人 。 攻击者可能通过(例如知道某个人的邮编 , 生日 , 性别等)包含个人信息的开放数据库获得特定个人的准标识列属性值 , 并与大数据平台数据进行匹配 , 从而得到特定个人的敏感信息 。 为了避免这种情况的发生 , 通常也需要对准标识列进行脱敏处理 , 如数据泛化等 。 数据泛化是将准标识列的数据替换为语义一致但更通用的数据 , 以上述医疗数据为例 , 对邮编和年龄泛化后的数据如下图所示 。

文章图片
K-匿名泛化脱敏处理后的医疗信息表
经过泛化后 , 有多条纪录的准标识列属性值相同 。 所有准标识列属性值相同的行的集合被称为相等集 。 K-匿名要求对于任意一行纪录 , 其所属的相等集内纪录数量不小于K , 即至少有K-1条纪录的准标识列属性值与该条纪录相同 。
K-匿名技术就是每个相等集(或称为等价组)中的记录个数为K个 , 那么当针对大数据的攻击者在进行链接攻击时 , 对于任意一条记录的攻击同时会关联到相等集中的其他K-1条记录 。 这种特性使得攻击者无法确定与特定用户相关的记录 , 从而保护了用户的隐私 。
K-匿名的实施 , 通常是通过概括(Generalization)和隐匿(Suppression)技术来实现 。 概括(Generalization)指对数据进行更加概括、抽象的描述 , 使得无法区分具体数值 , 例如年龄这个数据组 , 概括成一个年龄段(例如上表中的>=40岁) 。 而隐匿(Suppression)指不发布某些信息 , 例如上表中的用*号替换邮编的末三位 。 通过降低发布数据的精度 , 使得每条记录至少与数据表中其他的K-1条记录具有完全相同的准标识符属性值 , 从而降低链接攻击所导致的隐私泄露风险 。
K-匿名技术能保证以下三点:
攻击者无法知道某特定个人是否在公开的数据中
给定一个人 , 攻击者无法确认他是否有某项敏感属性
攻击者无法确认某条数据对应的是哪个人
但从另外一个角落来看 , K-匿名技术虽然可以阻止身份信息的公开 , 但无法防止属性信息的公开 , 导致其无法抵抗同质攻击 , 背景知识攻击 , 补充数据攻击等情况:
同质攻击:如在上面的K-匿名医疗信息表中 , 第1-3条记录的敏感数据是一致的 , 因此这时候K-匿名就失效 。 观察者只要知道表中某一个用户的邮编是476*** , 年龄在20多岁 , 就可以确定他有心脏病 。
推荐阅读
- 博科园|再连接光量子通信网络,就能实现量子互联网啦!,量子计算机诞生
- #魏延#当年的\计算机天才\魏延政,入职华为百万年薪,抗癌5年41岁去世
- 互联网的一些事|14隐私功能难产,欧洲16家广告协会反对,苹果iOS
- 『』1957年,由于计算失误,人类创造出了一个206倍音速的核动力井盖
- 「芯片」华为有救了!电子芯片已找到“替代品”,计算能力将提高10倍
- 右手网|官方公告重申隐私和安全立场,抖音国际版TikTok在印度暂停服务
- 7点科技|计算力可容纳腾讯所有现业务,腾讯清远据中心集群开服
- 「科学家」?3男3女科学家“共处”封闭舱一年,没有隐私,出来后人麻木!
- 飞象象声|中国联通唐雄燕:5G呼唤边缘计算主要在于三大动因
- IT之家|小米首届安全与隐私宣传月收官:希望提升全员安全隐私保护意识
