机器之心|窥一斑而知全豹，三篇论文遍历ICLR 2020新型表征方式( 三 )

本文插图

在第二种图中，作者在使用加权平均值作为聚合函数，这里的权重是在图建立时得到的：

本文插图

接下来，作者对上面计算得到的双向嵌入进行融合：

本文插图

这里的融合操作如下式所示：

本文插图

这里的 \ odot 是点乘， \sigma()表示 simoid 函数， z 是门向量。最后，作者使用 Gated Recurrent Unit(GRU)对节点嵌入进行更新：

本文插图

更新完后，如最开始所说，作者对最终第 n 跳的结果进行线性映射和 max-pooling 操作，从而得到图嵌入。
1.4 实验结果
因为本文介绍的并不是完整的算法，所以这里不展示后面完整的熔断实验（ablation study），图 3 展示了整体系统的结果，可以看到虽然比 ground truth 要差一点，但是比现有的模型都要先进。

本文插图

图 3：实验结果。
1.5 小结
这篇文章有很多信息，都很具有启发性，比如在 DAN 中对各种嵌入的处理，如何将另一段文本的信息融合到当前文本中的处理方式等，以及图的建立方法和图嵌入的计算方式等。不管是图的表征还是文本的表征，这篇论文都可以提供很好的初始想法。
2. Massively Multilingual Sparse Word Representations

本文插图

论文链接：https://openreview.net/forum?id=HyeYTgrFPB
2.1 算法概述
本文的题目已经很直白的表达了本文的主要任务——找到一种稀疏的词表征方式（sparse word representations），并且是多语言通用的（multilingual），也就是说在不同语言中具有相似意义的词会有相似的稀疏向量。之所以选择稀疏的词表征方式，最直接的好处是某些资源丰富的源语言的稀疏表示可以直接用于某种目标语言，这样模型就更小了，而且模型的可解释性更高。
当然这种稀疏的词表征其实在很多其他特定任务中也有奇效。本文作者提出了一种高效（优化函数为凸函数）且可适应于多语言转换任务（基于共享语义单元）的算法。
2.2 算法细节
整体算法如图 4 所示，算法的输入 (require) 是源语言和目标语言的嵌入（GloVE 等）以及不同语言之间对应的翻译（semantically equivalent word pairs），最终得到的结果是 \ alpha^s, \alpha^{t_i} ，这些分别是源语言（s）和多个目标语言（t_i）的稀疏向量，这些表示中不同语言中具有相似意义的词会有相似的稀疏向量，至于为什么这些 \ alpha 可以做到这些，会在后面的具体介绍中提及。论文中是以模块为单位进行介绍的，为了方便理解，本文我们按照这个伪代码的顺序走一遍。
建议读者可以自己再去读一下原论文的对应部分，因为有些步骤的顺序有其自己的原因，这里会大概提及，但是原文的排版方式确实更能突出其算法的优势，本文按照伪代码来介绍只是为了更方便理解。

本文插图

机器之心|窥一斑而知全豹，三篇论文遍历ICLR 2020新型表征方式( 三 )

推荐阅读

女排队员|请求追究造谣者刑事责任，朱婷报案称网民造谣诽谤

感情|原创王思聪女友官宣分手被群嘲，再发文力证清白，望大家停止恶意揣测

诗韵妈妈育儿经尤其是这5项关乎胎儿安危，孕妈妈要牢记，“孕检”再穷也要做

百变孙佳雨极致摩登复古长发及腰引领撞色风潮

##客厅安装灯带有必要吗？

摘下|她是《射雕英雄传》中梅超风，10年不摘帽子，摘下令人感慨颇多

巅峰战队今天才知道，华为手机按一下这个键，10秒就能生成照片视频

广西：白头叶猴数量增至1200只左右

[手游观察室]海岛纪元：鱼儿也能当坐骑？坐在浮空的峡湾鳐鱼上真是太帅了

小宝育儿课堂长大后多半没出息，你家孩子中没？，孩子吃饭时若有3种“表现”

尿路感染按摩反射区

【】男篮国家队最新集训名单出炉杜锋详解人员构成

你养的多肉，最长的时间是多少年？5年的群生老桩，谁见了不动心

我是那水还是鱼|心理学：你最中意哪一个铃铛？测试你十年后有多少存款

实体|定期存款利率为何整体跌了？专家：金融支持实体经济恢复

新民晚报|名牌风衣、围巾都是假货？涉千万元制售假冒国际品牌服装案提起公诉

味觉：茶的浓淡，是味觉的审美

10寸屏幕长宽多少厘米，15寸显示屏等于多少厘米

Centos 7 添加磁盘设备

「老照片」珍贵历史老照片: 图2让男人移不开眼、图4让人唾弃、图6至今是谜