Google|开源|谷歌发布最新“天马”模型,自动生成文本摘要已超越人类( 二 )


Google|开源|谷歌发布最新“天马”模型,自动生成文本摘要已超越人类
本文插图

不过 , 虽然经天马模型预训练后的性能表现能够与人类相媲美 , 它还是会存在失误 。 比如研究人员就以下文本进行了预训练 。 XSum数据集中的这篇示例全文没有提到数字“4” , 但是在文本提取中 , 天马能够抽象出文本摘要“No proposals have been submitted to preserve four Royal Navy frigates for reuse, the BBC has learned.” , 而且从2-5都是如此 。
Google|开源|谷歌发布最新“天马”模型,自动生成文本摘要已超越人类
本文插图

但是在第六艘护卫舰时 , 天马出现了失误 , 其摘要中显示的是“七” 。 说明模型在重复文本提取方面还需要进一步优化 。 为此 , 研究人员也将该项目公开发布到了Github上 。
雷锋网雷锋网雷锋网
如果你想了解更多研究内容 , 可参考:
https://ai.googleblog.com/2020/06/pegasus-state-of-art-model-for.html
https://arxiv.org/abs/1912.08777
【Google|开源|谷歌发布最新“天马”模型,自动生成文本摘要已超越人类】https://github.com/google-research/pegasus


推荐阅读