米粒创意 登顶权威榜单VCR,重磅!百度多模态模型ERNIE-ViL刷新5项任务纪录( 三 )


米粒创意 登顶权威榜单VCR,重磅!百度多模态模型ERNIE-ViL刷新5项任务纪录
文章图片
结语
【米粒创意 登顶权威榜单VCR,重磅!百度多模态模型ERNIE-ViL刷新5项任务纪录】听懂、看懂、理解环境是人工智能的重要目标之一 , 实现该目标的首要任务是让机器具备多模态语义理解能力 。 此次百度提出的知识增强多模态模型ERNIE-ViL , 首次将场景图知识融入多模态模型的预训练过程 , 在视觉问答、视觉常识推理等5个任务上刷新纪录 , 为多模态语义理解领域研究提供了新的思路 。 除了上述公开数据集效果突破外 , ERNIE-ViL技术也逐步在真实工业应用场景中落地 。 未来百度将在该领域进行更深入的研究和应用 , 使其发挥更大的商业和社会价值 。


推荐阅读