少年帮|Facebook开源差分隐私库Opacus，可保护数据隐私且高效训练Prytorch模型( 二 ) 如何保护数据集隐私

需要强调的是，由于PyTorch优化器可以查看参数梯度，因此，可以直接将噪声添加到其中，并允许任何人简单地训练差分私有模型，其代码如下：
此外，噪声的定量问题是这一解决方案的关键。因为过多的噪声会破坏信号，过少的噪声将无法保证隐私。
为了确定合适的比例，首先要查看小批量中梯度的最大范数。因为离群值比大多数样本具有更大的梯度，需要确保这些异常值的私密性。
通常研究人员会采用微批量（microbatch）的方法。该方法是在小批量处理中计算每个样本的梯度，分别裁剪梯度，将其累积回单个梯度张量，然后将噪声添加到总和中。该方法具有简单性和兼容性和特点，但计算每个样本的梯度，限制了训练的速度。
在这里， Opacus采用了另一种更高效的解决方案。该方案由谷歌于2015年提出，其论文为《EFFICIENT PER-EXAMPLE GRADIENT COMPUTATIONS》，对于所有ML样本而言，它可以计算整个批次的梯度向量，同时优化性能。
Facebook在论文中表示，他们在训练标准神经网络时，采用该方法获得了所有需要的梯度向量。该方法的不同之处在于，对于模型参数，可以单独返回给定批次中每个示例的损耗梯度，如下所示：
通过在运行各层时跟踪一些中间数量，可以使用适合内存的任何批次大小进行训练，这种方法比其他软件包中的微批量方法快一个数量级。
安装方法目前，这款Opacus高速库已经在Github开源。所有机器学习从业者和差异隐私科学家都可以下载使用。
Github地址：
Facebook表示，他们希望通过开发Opacus之类的PyTorch工具，可以使对此类隐私保护资源的访问民主化，同时通过使用PyTorch的更快，更灵活的平台弥合了安全社区和通用机器学习工程师之间的鸿沟。
用户可以直接从Github安装最新版本，代码如下：
git clone .git
cd opacus
pip install -e .
另外，需要注意的是，要使用差分隐私训练模型，需要声明PrivacyEngine ，并将其附加到优化器，再运行，例如：
引用链接：雷锋网雷锋网雷锋网

少年帮|Facebook开源差分隐私库Opacus，可保护数据隐私且高效训练Prytorch模型( 二 )

推荐阅读

德安东尼|1-3落后！德帅仍信心十足：我与哈登有翻盘经验，球迷评论太扎心

各种茶功效各异恰当搭配饮用让健康美丽加分

4种适合养在客厅的树是什么？

金鱼|金鱼花蕾不生长，枯萎，注意保育，有序地盛开，不枯萎

3DM游戏网|Now订阅服务存在涨价可能性，索尼PS+，PS

连衣裙|直到今天我才知道，招聘求职平台还能这么用，简直解决了不少痛点

「宝宝」宝宝出荨麻疹怎么办

鱼塘手竿钓鱼技巧视频鱼塘手竿钓鱼技巧

乳腺增生和乳腺癌

青藏高原和一些高山地区自然景观呈明显的什么变化高原的自然特征

这场特殊高考，注定成为此生的重要收获

人工智能声纹商战正当年

驱动之家快手海外版Zynn被下架：只因一条视频被投诉

[咖啡]老板儿，一杯中热美配烘烘儿太阳

『王者荣耀』昭君星元明日上新！，人气偶像换新装

光明网|四胞胎家脱贫记

哪一瞬间会让你觉得跟最好的朋友再也回不去了

穿搭|41岁的高圆圆又穿上了"直男斩"吊带裙，美的很高级

台球不闹腾|先后出局！瑞恩·戴、钱德勒晋级胜者组，陈飞龙、威尔逊先后破百

朋友说有同一个人跟踪了她几个月，有可能是被迫害妄想症吗