飞行的小猪|谷歌联手DeepMind提出Performer：用新方式重新思索注意力机制( 二 )

本文插图

案例：蛋白质序列建模
蛋白质是具有复杂三维结构和特定功能的大分子，对生命来说至关重要。与单词一样，蛋白质被指定为线性序列，其中每个字符是20个氨基酸构建块中的一个。
将 Transformers 应用于大型未标记的蛋白质序列产生的模型可用于对折叠的功能性大分子进行正确的猜测。
Performer-ReLU (使用基于 relu 的注意力，这是一个不同于 softmax 的广义注意力)在蛋白质序列数据建模方面有很强的表现，而 Performer-Softmax 与 Transformer 的机能相匹配，正如理论所猜测的结果那样。

本文插图

下面，我们可视化一个蛋白质Performer模型，使用基于 relu 的近似注意力机制进行练习，使用 Performer 来估计氨基酸之间的相似性，从序列比对中分析进化替代模式得到的替代矩阵中恢复类似的结构。

本文插图

更一般地说，我们发现局部和全局注意力机制与用蛋白质数据练习的Transformer模型一致。 Dense Attention的近似Performer有可能捕获跨越多个蛋白质序列的全局相互作用。

本文插图
【飞行的小猪|谷歌联手DeepMind提出Performer：用新方式重新思索注意力机制】

作为概念的验证，对长串联蛋白质序列进行模型练习，会使得常规 Transformer 模型的内存过载，但 Performer模型的内存不会过载，由于它的空间利用很高效。
结论
Google AI的这项工作有助于改进基于非稀疏的方法和基于Kernel的Transformer ，这种方法也可以与其他技术互操作，研究职员甚至还将 FAVOR 与Reformer的代码集成在一起。同时研究职员还提供了论文、 Performer的代码和蛋白质语言模型的代码链接。
Google AI的研究职员相信，他们对于Performer的研究开辟了一种关于Attention、Transformer架构甚至Kernel的全新的思维方式，对于进一步的改进有巨大的启示作用。

本文插图

飞行的小猪|谷歌联手DeepMind提出Performer：用新方式重新思索注意力机制( 二 )

推荐阅读

牛肉肥肉发黄怎么回事牛肉肥肉发黄还能不能吃

暴雨|17号台风“狮子山”即将登陆：华南地区将迎来大范围降雨

中金|中金8月经济数据前瞻：国内外需求继续改善

中年女性应避免的十大健康误区

物理|“3+1+2”新高考模式下，考生不选这一科目，会失去很多机会

闪婚后离婚的几率高吗,闪婚闪离算二婚么-

北京15年毕业生税后工资多少饿不死

南航快乐飞

技嘉主板BIOS怎么进入?

巨蟹座|巨蟹座交往的5大禁忌，即使再爱你，也没办法包容你这样做

蠲痹汤治疗双膝关节冷痛

情感|她是孔家最受宠的女儿，为了爱情家穷书生，最后却是如此结局！

茶籽饼清塘需不需要解毒，怎么用茶籽饼清塘

6000mAh长续航小钢炮，联想乐檬K12 Pro手机初体验

小艾汽车|经常清理这个孔是关键，男司机：越开越有劲了！，不管汽车多少钱

梦寒说时尚36岁桂纶镁仍秀身材，反倒是景甜很保守，40岁董洁敢穿流苏裙

冬天要如何泡黑茶呢,冬天如何喝茶

土行孙@圣人之下，孔宣谁都不怕，却唯独怕这位凡人，曾打得孔宣落荒而逃

贾敬华手机一年的耗电量一般是多少钱？

吴邪和解雨臣在秦岭神树就认识了为什么到终极笔记又不认识了？