NLP实战:利用Python理解、分析和生成文本 | 赠书( 四 )


基于搜索的聊天机器人应确保其对话数据库包含令人愉快或有用的对话 , 并且它们应该是设定个性的机器人预期交流的一些主题 。 对于基于搜索的机器人 , 一些好的对话资源例子包括电影对话脚本、IRC频道上的客户服务日志(用户满意的部分)和人类之间的直接消息互动(如果那些人愿意与我们分享的话) 。 如果没有获得想要使用的对话中涉及的所有人的书面同意 , 请不要使用大家自己的电子邮件或短消息日志 。
如果决定将机器人之间的对话合并到语料库中 , 那么请千万小心 。 我们的数据库中只需要那些至少有一个人看起来对交互感到满意的语句 , 哪怕只是继续对话 。 除非是真正非常智能的聊天机器人 , 否则很少采用机器人之间的对话 。
基于搜索的聊天机器人可以使用历史对话日志来查找和机器人的交谈对象刚刚说的话类似的语句示例 。 为了便于搜索 , 应该把对话语料库组织成语句-回复对 。 如果回复作为被回复的语句 , 那么该回复应该在数据库中出现两次 , 一次作为回复 , 然后再作为促使回复的语句 。 数据库表中的回复列随后可作为“语句”(或促使)列的语句的回复依据 。
光了解上面这些NLP的知识其实对学习NLP来说是完全不够的 。 那么如何去高效完整地掌握NLP的整体框架和所有知识呢?相信这一本《自然语言处理实战:利用Python理解、分析和生成文本》可以帮到你 。
NLP实战:利用Python理解、分析和生成文本 | 赠书
本文插图
自然语言处理实战 利用Python理解、分析和生成文本
作者:[美]霍布森?莱恩(Hobson Lane) ,科尔?霍华德(Cole Howard) ,汉纳斯?马克斯?哈普克(Hannes Max Hapke)
译者: 史亮 ,鲁骁 ,唐可欣 ,王斌
注:本书分为3部分:第一部分介绍NLP基础 , 包括分词、TF-IDF向量化以及从词频向量到语义向量的转换;第二部分讲述深度学习 , 包含神经网络、词向量、卷积神经网络(CNN)、循环神经网络(RNN)、长短期记忆(LSTM)网络、序列到序列建模和注意力机制等基本的深度学习模型和方法;第三部分介绍实战方面的内容 , 包括信息提取、问答系统、人机对话等真实世界系统的模型构建、性能挑战以及应对方法 。
-END-
NLP实战:利用Python理解、分析和生成文本 | 赠书
本文插图
Today's Interaction
今日互动
你对NLP感兴趣吗?
【NLP实战:利用Python理解、分析和生成文本 | 赠书】关注AI科技大本营并评论分享你对自然语言处理的见解 , 我们将从中选出10条优质评论分别获得赠书1本 , 截止时间11月15日晚20:00 。


推荐阅读