隐私|共享智能是如何保护数据安全与人们隐私的?( 二 )
共享智能第二项技术是可信执行环境 , 它是基于硬件的解决方案 , 主要解决两个大的问题 , 一个是内存窥探和软件篡改问题 , 通过内存中开辟加密空间 , 称为飞地(Enclave)保护来自虚拟机、操作系统和恶意程序的攻击 。 其次为了确保软件篡改涉及远程认证RA机制 , 确保在这里执行程序是经过用户认证和授权的程序 , 通过密码箱飞地的设计 , 可以在这里完成大量的保护隐私计算 。
文章图片
第三项是多方安全计算技术 , 包括秘密分享、同态加密和混淆电路 。 用的比较多的有两个 , 一个是秘密分享 , 秘密分享通过原始数据随机拆分 , 得到密态数据之后 , 多方协同密态下面进行计算 , 之后得到相应计算结果 , 整个优势是计算复杂度比较小 , 因为有大量密态数据交互 , 所以网络通讯比较大 , 同时需要多个参与方参与 。
第二同态加密 , 在密态下面对密态数据进行加密 , 在密态下面进行计算得到结果 , 跟明文下得到结果是一样的 , 通过这样一个原理来实现密态下计算得到相应结果 , 相对来说计算复杂度要大 , 因为加减密计算复杂度是非常高的 , 但是网络通讯相对比较少 , 因为中间只需要单次通讯就OK了 。
这两个技术中间有很强的安全性和封闭性 , 安全性是这里没有任何信息泄漏 , 可以很好进行复合运算 。
共享智能实施架构概述 介绍完前面背景信息和主要技术之后 , 我们看一下共享智能怎么实施 , 怎么用技术解决前面提到的核心问题 。
基于TEE的共享智能
文章图片
首先是基于TEE共享智能 , 首先利用SGX搭建分布式的TEE可信计算环境 , 里面有相应计算模块和认证模块 , 各个参与方之间相应的数据密文传到可信计算环境中完成分布式的计算 。
这里面有几个关键技术点 , 怎么样搭建出来可信异构计算集群 , 第二怎么在可信计算环境实现各式各样机器学习的框架 , 从而达到实现机器学习的完整工作流 。 它的优势是集中式部署 , 所以部署计算效率相对比较高 , 第二安全性比较高 , 即使集群里存在恶意的服务器也有比较好的防护能力 , 并且支持所有算法 , 这是TEE共享智能的优势 。
文章图片
如何搭建TEE可信集群呢?我们的目标是对普通用户提供和单机一样的可信执行环境 , 通过原来方式进行管理 , 将数据通过认证方式传到可信执行环境进行相应计算 。 里面有几个点 , 一是密钥同步中心 , 通过密钥同步中心用户只需要和同步中心做认证 , 由同步中心完成集群中其他节点的认证 , 而不需要用户自己与集群中所有节点做认证 。 第二 , Kubernetes云原生技术 , 可以很好的实现负载均衡、故障转移的机制 , 使得可信执行环境本身具备负载均衡 , 动态扩缩容特性 , 从而更好支持复杂计算和大数据计算能力 , 有了复杂计算和大数据计算能力 , 从而更好实现各式各样分布式AI计算能力 。
文章图片
有了可信计算环境之后 , 我们看一下怎么实现大规模分布式XGB的算法 。 在上图中 , 首先数据提供方通过两个飞地将数据传到可信计算集群里 , 在集群里对XGB进行了相应的改造 , 一是所以模型训练的计算都在飞地中完成 , 保证计算时数据安全;第二飞地之间的通讯通过TLS进行加密 , 保证了通信的安全;第三对飞地中的内存访问做了Oblivious加固 , 以防御侧信道攻击 。 通过这样方式得到分布式XGB模型 , 在模型发布的时候同样通过权限控制方式 , 使模型发布也是安全的 。
所以从数据提供到训练最后到模型发布 , 整个端到端的过程都是高安全的 。 我们通过构造了分布式可信质量空间跟算法进行加固之后 , 使得大规模数据在这样一个框架里可以实现多种机器学习算法 , 比如神经网络等方法都可以 , 同时因为中间每一步都进行了安全加固 , 所以整个过程是安全可信的 。
基于MPC的共享智能
文章图片
第二是基于MPC的共享智能技术 , 它主要通过多个协作方之间传递随机数和加密数的方式完成神经网络或者模型构建 , 所有模型本身都是加密 , 在密态计算空间完成计算 , 主要会涉及秘密分享、同态加密和混淆电路等技术 。
这里关键技术是密态存储和计算 , 并且确保这些机器学习算法的安全性 , 不会泄露信息 , 在确保安全性之后高效实现大规模深度学习算法 。 它的优势是数据不需要出域 , 安全性非常高 , 这里由于算法复杂度比较高 , 对于加密函数的性能消耗是非常高的 , 部分实现难度也很大 , 因为party A和party B都需要进行部署 , 降低部署成本也是需要解决的问题 。
推荐阅读
- 赢创|巴斯夫赢创押注智能养猪 优化猪肉价值链
- 中小企业|中小企业如何共享数字化转型红利
- 西门子智能家居智能家居产品|AWS助西门子打造全新智能家居系统 2020智能家居市场竞争格局及供需分析预测
- 我国最大规模5G智能电网建成|我国最大规模5G智能电网建成 位于山东青岛缓解5G运营最大难题
- 美国空军|Geospark Analytics公司研发的Hyperion云平台让美国空军能够进行威胁情报共享
- 检测|百度人工智能技术再突破 多模态活体检测算法获银行卡检测中心增强级认证
- 制造|新风口下的“智能制造”乘风破浪,为信息产业发展赋能
- 智能硬件|歌尔股份深度解析:TWS耳机放量引领增长,精密制造内功铸就成长
- 共享电动车|疯狂作案6起!偷盗共享单车、共享电车电机,男子被批捕
- 智能手机线上销量中国智能手机|2020全球智能手机线上销量占市场28% 中国智能手机行业供需趋势
