腾讯数据安全专家谈联邦学习开源项目FATE:通往隐私保护理想未来

  数据孤岛、数据隐私以及数据安全 , 是目前人工智能和云计算在大规模产业化应用过程中绕不开的“三座大山” 。

  “联邦学习”作为新一代的人工智能算法 , 能在数据不出本地的情况下 , 实现共同建模 , 提升AI模型的效果 , 从而保证数据隐私安全 , 突破数据孤岛和小数据的限制 , 这无疑成为了跨越“三座大山”的途径之一 。 因此 , 作为联邦学习全球首个工业级开源项目 , FATE也受到了各方关注 , 开发者们对加入社区建设纷纷表示期待 。 (FATE开源社区地址:https://github.com/FederatedAI/FATE)

  而在贡献者激励机制推出以后 , FATE开源社区迎来了首位一级贡献者——来自腾讯云的刘洋 。 联邦学习怎样赋能行业数据安全?隐私保护从业者怎样评价FATE?刘洋博士在采访中表达了自己的看法 。


腾讯数据安全专家谈联邦学习开源项目FATE:通往隐私保护理想未来

----腾讯数据安全专家谈联邦学习开源项目FATE:通往隐私保护理想未来的桥梁//----

  数据运算提效70% 加速企业应用落地

  博士毕业于澳大利亚国立大学的刘洋 , 同时是腾讯云的高级研究员 , 负责腾讯神盾沙箱的隐私保护算法部分 。 刘洋表示 , 因自身从业领域的缘故 , 从年初就开始密切关注着“联邦学习” 。

  也因此 , FATE进入了其视野 , 受到了刘洋及腾讯云团队的重点关注 。 在对FATE进行深入了解后 , 刘洋认为腾讯神盾沙箱打造的隐私安全+分布式学习的理念 , 与FATE要解决的“数据安全”“数据隐私”“数据合规”三大问题不谋而合 , 并逐步开始使用FATE满足神盾沙箱的功能需求 。

腾讯数据安全专家谈联邦学习开源项目FATE:通往隐私保护理想未来的桥梁。


腾讯数据安全专家谈联邦学习开源项目FATE:通往隐私保护理想未来

----腾讯数据安全专家谈联邦学习开源项目FATE:通往隐私保护理想未来的桥梁//----

  刘洋表示 , 经过长期接触后 , 对FATE的逻辑回归和XGBoost算法流十分认同 , 因此也开始加入FATE开源社区建设 , 提出了优化建议——利用对称的仿射密码替代Paillier密码 , 将训练时间提升70%以上 , 从而给同态运算“减负” 。 未来合作企业在应用优化过后的FATE版本时 , 可以有效降低数据运算的时间成本 , 提升企业在AI时代的技术竞争能力 。

  行业负重前行 数据安全迫在眉睫

  AI应用场景中 , 将多方数据中心式合并处理的传统合作方式 , 存在着严重的隐私泄露问题 , 这一症结甚至成为了企业大规模应用AI的关键阻碍 。

  在刘洋看来 , 破局关键仍在于数据安全问题的解决 , 即数据privacy和utility的折衷问题 。 具体来说 , 数据要想安全的从孤岛分享出去 , 必须经历某些“蒙面”操作:通过密码学工具将有效数据转换成乱码 , privacy保住了 , 但密钥在谁手中 , 极大的影响数据的utility;用噪声混淆原始数据也可以 , 例如差分隐私 , 噪声越大 , 越保证privacy , 但使用者拿到数据发挥的utility越低 。 怎样在privacy和utility中寻求一条折衷之路 , 是数据安全流通的关键问题之一 。


推荐阅读