中国骄傲!出身清华,斯坦福博士毕业,她的毕业论文让美国疯狂!( 六 )

开放域问答结合了来自信息检索与阅读理解的挑战 , 旨在回答来自网络或大型百科全书(如维基百科)的一般性问题 。

对话式问答结合了来自对话和阅读理解的挑战 , 解决了一段文字中的多轮问答问题 , 比如用户如何与智能体互动对话 。 图 1.3 展示了来自 COQA 数据集 (Reddy et al., 2019) 的一个示例 。 在该例子中 , 一个人可以基于 CNN 文章内容提出一系列相互关联的问题 。

中国骄傲!出身清华,斯坦福博士毕业,她的毕业论文让美国疯狂!

图 2.2:论文整理了神经阅读理解中数据集(黑色)和模型(蓝色)的最新重要进展 。 在这个表中 , 除 BERT (Devlin et al., 2018) 外 , 以相应论文的发表日期排序 。

六年博士心路历程

在博士论文中 , 陈丹琦也介绍了自己博士期间的学习经历 , 感谢了在前进过程中给予了她极大帮助的一批人 , 包括父母、老师、爱人、朋友 。 机器之心编译介绍了致谢中的部分内容 , 让我们一窥优秀的人砥砺前行的历程:

对于我来说 , 在斯坦福的六年是一段难忘的宝贵经历 。 2012 年刚开始读博的时候 , 我甚至都不能说出流利的英语(按照要求 , 我要在斯坦福修 5 门英语课程) , 对这个国家也知之甚少 , 甚至从未听说过「自然语言处理」这一概念 。 不可思议的是 , 在过去的几年里我竟然一直在做语言方面的研究 , 训练计算机系统理解人类语言(多数情况下是英语) , 我自己也在学习用英语进行沟通、写作 。 同时 , 2012 年也是深度神经网络开始起飞并主导几乎所有我们今天看到的人工智能应用的一年 。 我从一开始就见证了人工智能的快速发展 , 并为即将成为这一浪潮的一份子而感到兴奋(有时是恐慌) 。 如果没有那么多人的帮助和支持 , 我也不可能走到今天 。 我由衷地感谢他们 。


推荐阅读