「人工智能」一文全览,ICLR 2020 上的知识图谱研究( 五 )
再回到传统的感应式KG嵌入设置(transductive KG embedding setup):
— GNN?是的!— Multi-多关系?是的!— 建立关系的嵌入?是的!— 适合知识图谱吗?是的!— 适用于节点/图形分类任务吗?是的 。
10、Composition-based Multi-Relational Graph Convolutional Networks
文章链接:https://openreview.net/pdf?id=BylA_C4tPr
Vashishth 等人提出的 CompGCN体系结构为你带来了所有这些优点 。 标准的图卷积网络以及消息传递框架在考虑图时 , 通常认为边是没有类型的 , 并且通常不会构建边的嵌入 。
知识图谱是多关系图 , 边的表示对链接预测任务至关重要 。 对于(Berlin,?,Germany) 的query , 你显然是要预测capitalOf , 而不是childOf 。
在CompGCN中 , 首先会为输入的 KG 填充反关系(最近已普遍使用)和自循环关系(用来实现GCN的稳定性) 。 CompGCN采用编码-解码方法 , 其中图编码器构建节点和边的表示形式 , 然后解码器生成某些下游任务(如链接预测或节点分类)的分数 。
本文插图
CompGCN intuition. Source: Vashishth et al
节点表示是通过聚集来自相邻节点的消息而获得的 , 这些消息对传入和传出的边(图中的Wi , Wo以及那些自循环)进行计数 , 其中交互函数对 (subject, predicate)进行建模 。
作者尝试了加法(TransE-style) , 乘法(DistMult-style)和圆相关(HolE-style)的交互 。 在汇总节点消息之后 , 边的表示将通过线性层进行更新 。 你几乎可以选择任何你喜欢的解码器 , 作者选择的是 TransE , DistMult 和 ConvE 解码器 。 CompGCN在链接预测和节点分类任务方面都比R-GCN要好 , 并且在性能上与其他SOTA模型相当 。 性能最好的CompGCN是使用带有ConvE解码器的基于循环相关的编码器 。
11、Probability Calibration for Knowledge Graph Embedding Models
文章链接:https://openreview.net/pdf?id=S1g8K1BFwS
Last, but not least , Tabacoff和Costabello考虑了KGE模型的概率校准 。 简单来说 , 如果你的模型以90%的置信度预测某个事实是正确的 , 则意味着该模型必须在90%的时间里都是正确的 。 但是 , 通常情况并非如此 , 例如 , 在下图中 , 表明TransE倾向于返回较小的概率(有点“悲观”) 。
本文插图
Source: Tabacoff and Costabello
作者采用Brier评分来测量校准 , 采用Platt缩放和等渗回归来优化校准评分 , 并提出了在没有给出“hard negatives”的典型链接预测方案中对负样本进行采样的策略 。 于是 , 你可以校准KGE模型 , 并确保它会返回可靠的结果 。 这是一个非常好的分析 , 结果表明在一些工业任务上 , 你可以用KGE模型来提升你对自己算法/产品的信心 。
四、用GNN做实体匹配 不同的知识图谱都有他们自己的实体建模的模式 , 换句话说 , 不同的属性集合可能只有部分重叠 , 甚至URLs完全不重叠 。 例如在Wikidata中Berlin的URL是https://www.wikidata.org/entity/Q64 , 而DBpedia中Berlin的URL是http://dbpedia.org/resource/Berlin 。
如果你有一个由这些异质URL组成的知识图谱 , 尽管它们两个都是在描述同一个真实的Berlin , 但知识图谱中却会将它们视为各自独自的实体;当然你也可以编写/查找自定义映射 , 以显式的方式将这些URL进行匹配成对 , 例如开放域知识图谱中经常使用的owl:sameAs谓词 。 维护大规模知识图谱的映射问题是一个相当繁琐的任务 。 以前 , 基于本体的对齐工具主要依赖于这种映射来定义实体之间的相似性 。 但现在 , 我们有GNNs来自动学习这样的映射 , 因此只需要一个小的训练集即可 。
推荐阅读
- 中金网长假归来投资如何布局?一文纵览海外市场五一表现
- 强基计划:什么是“强基计划”,对高考将产生怎样影响,一文了解!
- 湖南省人工智能产业联盟每日AI报0510
- 人工智能爱好者社区当心这个破坏家庭团结的数据泄露重灾区,多款APP违规采集个人信息
- 掘金界参与主,5月8日,由全球领先的人工智能平台公司商汤科技SenseTime
- 埃尔法哥哥人工智能与人类的未来
- AI途人工智能时代:AI“创作”的著作权归属
- 太平洋电脑网外媒:华为打算将人工智能进一步整合到其光伏业务中
- 前瞻产业研究院2020年中国人工智能行业市场规模及竞争格局分析:百度夺得数桂冠【组图】
- 大科技杂志社想说爱你不容易,人工智能
