『对话』会说话的机器人上岗 但让它们好好聊天仍是个技术活( 二 )

对于本次比赛的机器人在群聊回复方面出现的一些问题 , 张鹏解释说 , 这主要是由三方面原因造成的 。 首先对话机器人在理解群聊对话记录 , 回复的情感一致性及与其他机器人的交互三个方面存在一定的问题 。 所以群聊过程中出现了机器人自顾自回复或者是矛盾性回复等现象 。

其次 , 训练机器人聊天是需要大量数据的 , 但某些特定领域的对话数据相当有限 , 如本次比赛中的数码产品和美食主题 。 并且 , 这些领域的中文闲聊型对话数据的收集和对话系统的构建都是十分耗费人力的 。

第三 , 目前基于神经网络的对话系统主要依赖于大量结构化的外部知识库信息和对话数据 , 系统通过训练来“模仿”和“学习”人类说话 , 这也导致了回复语句单一的问题 。 因此 , 对话智能体需要通过对语言和语境的深度理解来更加有效地学习 。

像人一样聊天还需深入理解语境

“虽然深度学习技术被充分运用 , 技术水平有所提高 , 但是以目前的技术来说 , 要做到让机器人像人一样聊天还有一定的难度 。 ”张鹏表示 , 人类的对话是极其复杂的 , 其中每个语句都建立在对应的语境和上下文的基础上 , 朋友们在聊天时甚至能在对方说话之前就预料到下一句会说什么 。

若想要达到相当于人类对话的水平 , 目前有几种方法可以探讨 。 其中一种是构造庞大且高度复杂的AI模型 , 如现在基于Transformer结构的Bert模型和GPT模型 , 其参数量已达到数亿级 。 然而模型越大 , 从用户输入信息到对话系统反应之间的延时就越长 , 而且实质上 , 此类模型仍然需要依赖于大量的数据 , 这与人类的思考和学习方式不符 。

第二种是Meta Learning技术 , 这种技术需要机器人具备学会学习的能力 , 能够基于过往的经验快速地学习 。 这类模型是模拟人的思考与学习方式 , 从本质上更接近人类间的相互对话 。 但问题是我们需要结合具体的任务 , 提出基于Meta Learning的解决方案 , 这无疑需要更加深入的研究 。

第三种是强化学习技术 , 强化学习系统由智能体、状态、奖赏、动作和环境5部分组成 。 现在的研究工作主要是将强化学习应用于任务型对话系统的策略学习上 , 强化学习能解决基于规则策略存在的泛化能力差、人工成本高等问题 , 并且无需大量的训练语料 , 只需要一些目标 , 便能够提高任务型对话的质量 , 弥补了深度学习的一大缺点 , 当然强化学习也会带来很多挑战 , 比如智能体会给当前互动的环境带来一定的影响等 , 这些都是需要我们去不断探索和深入研究的 。


推荐阅读