沈向洋:从深度学习到深度理解( 三 )
2
从深度学习到深度理解
我们必须认真思考智能的真正含义是什么 , 这也是我今天真正想表达的 。 如果把人工智能进行分类 , 可以分为弱人工智能和强人工智能 。
本文插图
其中 , 弱人工智能对应的是深度学习 , 围绕单一任务点 , 需要大量数据做支撑 , 有时候不那么可靠 , 可移植性差/移植过后需要大量重新训练 。 正如上面GPT-2中的那些例子 , 深度学习支撑的“智能”在转移和泛化方面差了不少 。
强人工智能(robust AI)对应深度理解 , 强调系统化地解决宽泛的问题 , 具备灵活与动态的推理能力 , 可以很好地移植到不同场景 。 显然 , 我们当前需要的是强人工智能 。 毕竟 , 我们想要综合各种来源的知识 , 期望AI能够对世界上正在发生的事情进行推理 。 就像人类一样 , 能够在一种语境中学习 , 在另一种语境中应用 。
那么 , 近期有没有从深度学习转向深度理解的机会?在我看来 , 当前一些机器学习的结果对于每一个任务来说 , 已经不只是“分类器” , 而是robust AI 智能体 。 例如它可以通过实践继续学习技能和知识(强化学习) , 以及探索示例(无监督学习) 。 这类智能体的特点是用比较少的学习次数 , 就能解决非常新的任务 。
事实上 , 我最近思考robust AI的时候 , 对三个方面比较感兴趣 , 感觉这三个方面在实现robust AI时大有可为:
其一 , 构建大规模的强机器学习仿真器 。 不仅是游戏 , 还有自动驾驶等复杂系统 。
其二 , 对于机器学习本质的深度理解 。 从优化功能开始 , 思考我们从里面真正学到的是什么 。
其三 , 基于神经与符号的混合模型(Hybrid Neural/Symbolic Model for Robust AI) 。
本文插图
前两个不是今天的重点 , 我会介绍基于神经与符号的混合模型 。 最近 , 雷蒙德微软研究院写了一篇论文 , 题目为《SOLOIST: Few-shot Task-Oriented Dialog with A Single Pre-trainedAuto-regressive Model》 , 文章中提出了一种新的方法 , 能够利用迁移学习进行高效地大规模构建面向任务的对话系统 。
在我看来 , 这篇文章有两个亮点 , 其一是有个预训练模型GTG(Grounded Text generator) , 其二是该方法实现了真正的会话学习 。 下面我主要讲讲GTG 。
本文插图
如上图所示 , 是一个多领域对话任务的示意 , 其结果经过微调GTG产生 。 在对话的一开始 , 人类就要求推荐一个博物馆;机器紧接着根据景点搜索、位置等信息给出了建议 。 随后 , 人类又要求在相同的位置进行预订餐馆 , 并要求餐馆里有印度食物 。 机器根据 same area 推断出了人类所要求的位置在“小镇中心” , 显示出了很强的推理能力 。
本文插图
那么 , 这里面发生了什么呢?先看看经典的模块化对话系统架构 , 一般包括四个关键模块:
- 自然语言理解(Natural LanguageUnderstanding, NLU) :对用户的文本输入进行识别解析 , 得到槽值和意图等计算机可理解的语义标签 。
- 对话状态跟踪(Dialog StateTracking, DST) :根据对话历史 , 维护当前对话状态 , 对话状态是对整个对话历史的累积语义表示 , 一般就是槽值对(slot-value pairs) 。
- 对话策略(Dialogue Policy):根据当前对话状态输出下一步系统动作 。 一般对话状态跟踪模块和对话策略模块统称为对话管理模块(Dialogue manager,DM) 。
推荐阅读
- 津东小霸王|王者荣耀:深度剖析eStar诺言猫神赛后言行!传递怎样的信息?
- 仰卧撑运动园|中国足球却难学习曲线留洋,日本球员“组团”前往比利时“练级”
- 雅各布·邓恩|常人难以理解!英母亲原谅杀儿凶手,还资助其读书,和他成为挚友
- 聚光体育|聚光穿搭:学习异域风情,让你又飒又美
- |常人难以理解!英母亲原谅杀儿凶手,还资助其读书,和他成为挚友
- 周到|深度 | 将因凡蒂诺拖下水的“足球解密”,是足球界的阿桑奇
- 新华网|“中国互联网联合辟谣平台”学习强国号上线运行
- 北斗系统发言人:北斗在抗疫、抗洪中发挥重要作用 未来将全面推动其深度应用
- 深度工场|美军基地一片慌乱:上将下令保护好所有战舰,强敌三天内大举来袭
- 提速|启动新一轮深度混改 “绿地模式”探路提速
