科技排头陈丹琦新作：关系抽取新SOTApipeline挫败joint( 三 ) 机器之心报道编辑：魔王、小舟端到端关

研究人员首先研究了共享两个表示编码器能否提升性能。如下表5所示，简单地共享编码器对实体F1和关系F1分数均有所损害。研究人员认为，其原因在于两个任务具备不同的输入格式，需要不同的特征来预测实体类型和关系，因此使用单独的编码器可以学得更好的任务特定特征。

文章图片
该研究的分析结果显示：
实体信息有助于预测关系，但实验未表明关系信息可以大幅提升实体性能。
仅共享编码器对该研究提出的方法无益。
如何缓解pipeline方式中的误差传播问题
pipeline训练的一个主要缺陷是误差传播问题。使用gold实体（及其类型）进行关系模型训练，使用预测实体进行推断，可能会导致训练和测试之间存在差异。
为此，研究人员首先探究在训练阶段使用预测实体（而非gold实体）能否缓解这一问题。该研究采用10-wayjackknifing方法，结果发现这一策略竟然降低了最终的关系性能。研究人员假设其原因在于训练阶段引入了额外的噪声。
在目前的pipeline方法中，如果在推断阶段gold实体没有被实体模型识别出来，则关系模型无法预测与该实体相关的任何关系。于是，研究人员考虑在训练和测试阶段，对关系模型使用更多span对。实验结果表明，这无法带来性能提升。
这些常识未能显著提升性能，而该研究提出的简单pipeline方法却惊人的有效。研究者认为误差传播问题并非不存在或无法被解决，我们需要探索更好的解决方案。
此外，该研究使用的跨句语境对性能提升有所帮助，参见表2 。

科技排头陈丹琦新作：关系抽取新SOTApipeline挫败joint( 三 )

推荐阅读

cpc广告是什么意思.什么是CPM广告计费方式?

北青网综合|紧急通告：河北急寻2名无症状感染者接触人员

掘墓追电影|财运翻倍，发财赚大钱的4星座，扬眉吐气大翻身！，11月开始

脾胃不好会引起咳嗽吗

长途飞行，应怎么样派遣在飞机上的无聊时间

红叶禅师|葵花宝典与辟邪剑谱：为什么欲练神功，必先自宫？

刘姚尧的文字城堡|大师赛决赛重演？，斯诺克大赛诞生死亡之组？3名TOP18或同室操戈

特效感冒药有哪些？

好奇的萌娃控|原因是什么？多是因为以下3点，越来越多的80、90后成“啃老族”

『博智客』美国暗自抓狂，联合国传来一个又一个好消息！中国喜上眉梢

吴晓求：如果不开放，中国资本市场的改革力度和效果将会是有限的

物业|女主睡的是我的床？女子自家多年未住别墅成剧组拍摄地

贾玲机场登机照曝光，风格大变令网友惊呼：世上再无贾玲！

北京时间|每年平均捕杀800头，丹麦法罗群岛数百鲸鱼和海豚被捕杀，人口不到5万

岳飞和成吉思汗是不是一个时候的人?如果成吉思汗和岳飞是一个年代谁更厉害

时尚丽人风行|50岁李嘉欣真放得开！穿透视阔腿裤露内裤太性感，毫不避讳儿子

养生小王医师|特别是第五种，坚持下去宝宝更聪明，这几种食物坚决不给宝宝吃

台式电脑显卡图片台式电脑显卡天梯图

心理学,松子,早点|越是心地善良的人，往往命越不好？心理学：善良的3大缺点，早点知道更好

萝卜的风情|闺蜜老公一定会表现的健谈，幽默笑话：闺蜜和老公逛街

科技排头 陈丹琦新作：关系抽取新SOTApipeline挫败joint( 三 )

推荐阅读

科技排头陈丹琦新作：关系抽取新SOTApipeline挫败joint( 三 )