「AI科技评论」S. Yu 团队发布权威综述,六大开放问题函待解决,Philip( 三 )
最常用的表征空间是欧氏点空间 , 它将实体嵌入到向量空间中 , 并且通过向量、矩阵或张量对相互作用进行建模 。 人们也研究了其它的表征空间(包括复杂向量空间、高斯分布、流形空间、群) 。
相对于欧氏点空间 , 流形空间的优势在于它能够松弛基于点的嵌入;高斯嵌入可以表达出实体和关系之间的不确定性 , 以及多重关系语义;复杂向量空间中的嵌入可以有效地建模不同的关系连接模型 , 特别是对称/反对称模式 。
在编码实体的语义信息和获取关系属性时 , 表征空间起着非常重要的作用 。 当我们研发一个表征学习模型时 , 应该选择合适的表征空间 , 该表征空间被精心设计以匹配编码方式的特性 , 并且能够在表达能力和计算复杂度之间达到平衡 。
采用基于距离的度量的打分函数会用到相应的转化原则 , 而基于语义匹配的打分函数则会采用成分级别的操作 。 编码模型(尤其是神经网络)在对于实体和关系的相互作用建模的过程中起到了关键作用 。 双线性模型也受到了很多研究人员的关注 , 一些张量分解技术与此相关 。 其它方法则引入了文本描述、关系/实体类型 , 以及实体图像等辅助信息 。

文章图片
表2:对近期知识表征学习工作的总结 。 详情请参阅附录C
2、知识获取
知识获取旨在根据非结构化的文本构建知识图谱、补全一个现有的知识图谱 , 发现并识别出实体和关系 。 构建好的大型知识图谱对于很多下游应用是很有用的 , 可以赋予基于知识的模型常识推理的能力 , 因此为实现人工智能打下基础 。
知识获取的主要任务包括关系抽取、知识图谱补全、以及其它面向实体的获取任务 , 如实体识别和实体对齐 。 大多数方法单独地形式化定义知识图谱补全和关系抽取 。 然而 , 这两种任务也可以被整合到一个统一的框架中 。
Han等人基于互注意力机制提出了一种联合学习框架 , 这种互注意力机制被用于知识图谱和文本之间的数据融合 , 该框架同时解决了根据文本进行知识图谱补全和关系抽取的问题 。 此外 , 还有一些任务也与知识补全有关(例如 , 三元组分类和关系分类) 。 在本节中 , 我们将完整地回顾知识补全、实体发现和关系抽取三步知识获取技术 。
1)知识图谱补全(KGC)
由于大多知识图谱具有不完整性 , 人们研发知识补全技术将新的三元组添加到一个新的知识图谱中 。 典型的子任务包括链接预测、实体预测和关系预测 。 下面我们给出面向任务的定义3.
定义3:给定一个不完整的知识图谱G=(E , R , F) , 知识图谱补全旨在推理出缺失的三元组T={(h , r , t)|(h , r , t)?F} 。
初期的知识图谱补全研究重点关注为三元组预测学习低维嵌入 。 在本文中 , 我们将其称为「基于嵌入的方法」 。
然而 , 大多数这些方法都不能获取多级关系 。 因此 , 最近的工作转而探索多级关系路径并引入了逻辑关系 , 我们分别将其称为「关系路径推理」和「基于规则的推理」 。 三元组分类是知识图谱补全的一个辅助任务 , 它被用来评价事实三元组的正确性 。
2)实体发现
实体发现可以从文本中获取面向实体的知识 , 并且在各个知识图谱之间进行知识融合 。 根据具体情况 , 可以将实体发现任务分为几种不同的类别 。
我们以一种序列到序列(Seq2Seq)的方式探究实体识别任务;而实体分类任务则重点讨论的是有噪声的类型标签和零样本分类;实体消歧和对齐任务会学习统一的嵌入 , 它们提出迭代式的对齐模型解决对齐种子实体数量有限的问题 。 但是如果新对齐的实体性能很差 , 它将会面临误差累积的问题 。
近年来 , 针对特定语言的知识越来越多 , 因此必然激发了对于跨语言知识对齐的研究 。

推荐阅读
- 「定焦爱科技」3拯救低电量焦虑症,超大电池搭配超快闪充,续航出色的iQOO
- #科技小李#小屏爱好者嗨起来,4.7寸新iPhone确认四月发布,价格是大亮点!,原创
- 中国网科技@撤出液晶面板生产,三星将关闭两座工厂
- #即科技#107国赞同票作废!,想“加入”联合国?中国使用一票否决
- 【腾讯科技】全球应用市场第一季度大爆发:花费达234亿美元创纪录 时长增20%
- 即科技■决定权掌握在中国手,?联合国五常将变六常?此国获美俄一致力挺
- [笔记本电脑]乙辰科技正式发布首款WiFi6新品:北斗II号分布式无线路由器
- 『极速聊科技』目前仅剩10余人,暴风集团:员工持续大量流失
- 【科技生活快报】普京:已与欧佩克和美国就石油价格下跌问题进行讨论
- 「科技小数据」消费信贷的客户呈现出年轻化的趋势,新消费崛起
