CSDN@如何基于本地语音识别，搭建一款智能聊天机器人？

本文插图
作者 | 李秋键责编 | 屠敏出品 | CSDN（ID：CSDNnews）近几年来，人工智能发展火热，尤其是语音识别方面的落实项目更是普遍存在于我们的生活中，像手机中常见的语音助手、Siri 和电脑中的小娜等等，但是他们却很难做到私人订制的效果，即达到个人个性化的需求，所以今天我们的目的在于搭建一个个性化适用于自己的语音聊天机器人。这里我们这个项目的优点在于：

本地语音识别，可以彻底摆脱互联网，在自己电脑上实现语音识别；
搭建适用于自己的语音聊天库，当然这里我们将简单的借助互联网强大的知识库作为聊天库；
循环调用，实现监控效果。

下面简单介绍下语音识别应用近几年来的发展趋势：

具有越来越充实的专业知识库。就是指针对特定用例的专家级系统，比如帮助航空公司客服回答客户的问题，或者帮助医生做笔记。
趋于更强的个性化功能。使用类似的方法，可能会使得语音助手会用你喜欢的方式与你交谈。比如提供像匹配谈话对象的口音和音量这样的简单的功能。或者，智能助手也可以改变其表达方式。
由被动变主动。优秀的助手会在你提出要求的时候给你做事，而卓越的助手则不需要你提出要求，而是能够前瞻性地主动帮你解决问题。
反馈机制。我们的机器如何知道自己做对还是做错？就是通过反馈机制进行纠正错误。
新的交互方式。语音助手应该不仅仅局限于语音互动的想法，而是可以使用大量不同的信号来得出结论，比如心理学、读心术等等。

下面我们就正式进入我们今天的项目搭建！
实验前的准备
首先我们使用的python版本是3.6.5 。所测试的系统有windows10 ， windows7 ， Linux系统以及苹果系统。从这点也可以看出python多平台和多拓展性、易于迁移的优点。
所使用的的Python库有request库，其目的是用来加载网络聊天库；keras库用来加载本地语音识别模型等等。
语音聊天的建立
1、录音麦克风
首先我们将要借助pyaudio库进行录音其中定义参数有取样频率，声音阈值等等。具体可见下面详细代码：

class GenAudio(object): def __init__(self): self.num_samples = 2000 # pyaudio内置缓冲大小 self.sampling_rate = 8000 # 取样频率 self.level = 1500 # 声音保存的阈值 self.count_num = 20 # count_num个取样之内出现COUNT_NUM个大于LEVEL的取样则记录声音 self.save_length = 8 # 声音记录的最小长度：save_length*num_samples个取样 self.time_count = 8 # 录音时间 ， 单位s self.voice_string =def save_wav(self, filename): wf = wave.open(filename, 'wb') wf.setnchannels(1) wf.setsampwidth(2) wf.setframerate(self.sampling_rate) wf.writeframes(np.array(self.voice_string).tostring) wf.close def read_audio(self): pa = PyAudio stream = pa.open(format=paInt16, channels=1, rate=self.sampling_rate, input=True, frames_per_buffer=self.num_samples) save_count = 0 save_buffer =time_count = self.time_count while True: time_count -= 1 # 读入num_samples个取样 string_audio_data = http://news.hoteastday.com/a/stream.read(self.num_samples) # 将读入的数据转换为数组 audio_data = np.fromstring(string_audio_data, dtype=np.short) # 计算大于?level?的取样的个数 large_sample_count = np.sum(audio_data > self.level) print(np.max(audio_data)),"large_sample_count=>", large_sample_count # 如果个数大于COUNT_NUM ， 则至少保存SAVE_LENGTH个块 if large_sample_count > self.count_num: save_count = self.save_length else: save_count -= 1 if save_count < 0:if save_count > 0: save_buffer.append(string_audio_data) else: if len(save_buffer) > 0: self.voice_string = save_buffer save_buffer =print("Recode?a?piece?of??voice?successfully!") return True if time_count == 0: if len(save_buffer) > 0: self save_buffer =printreturn True else:return Truer = GenAudior.read_audior.save_wav("test.wav")
上一页
1
2
3
下一页
		  	






























推荐阅读

           
                  
              
                  中国军网|这就是军人优先！抗洪抢险火箭军来了！ 
                
                   
                
              
            

                  
              
                  柠檬汽水呀|第二却是我国的一个友好国家，印度第一大军购对象是俄罗斯 
                
                   
                
              
            

                  
              
                  ajax请求的五个步骤代码！ajax如何使用？ 
                
                   
                
              
            

                  
              
                  如何鉴别红茶,普绿古树红茶 
                
                   
                
              
            

                  
              
                   父亲|她看了刘邦众人一眼，立马对父亲说投降吧！他们以后都是王侯！ 
                
                   
                
              
            

                  
              
                  不同场合自我介绍时，「我是XX」和「我叫XX」有何不同，如何选择？ 
                
                   
                
              
            

                  
              
                  笑抗新冠病毒：每天笑不停：教你一个藏私房钱的小窍门 
                
                   
                
              
            

                  
              
                  李亚迪|印尼19岁少夫软禁妻子防出轨，因怕74岁老婆太有魅力 
                
                   
                
              
            

                  
              
                  儿子不回家过年 山东老妈邮寄666元“包饺子套餐” 
                
                   
                
              
            

                  
              
                  王者|双排用什么CP组合？貂蝉加吕布上分超稳，而他们俩却只能打娱乐！ 
                
                   
                
              
            

                  
              
                  塔罗师芷蕾：激情拥抱，甘愿为爱重蹈覆辙，与旧爱坠入情网，接下来七天 
                
                   
                
              
            

                  
              
                  香港▲香港失业率升至6.2% 为15年来新高 
                
                   
                
              
            

                  
              
                  美国联邦储备系统|美联储27周放水16万亿后，美联储或“弹尽粮绝”，可能变脸，有新变化 
                
                   
                
              
            

                  
              
                  丝瓜与游戏|转移、舔包并不是全部功能，绝地求生中烟雾弹的妙用 
                
                   
                
              
            

                  
              
                  热气球升空原理和玩法介绍 
                
                   
                
              
            

                  
              
                  蘑菇和胡萝卜能一起吃吗 
                
                   
                
              
            

                  
              
                  江苏南京市溧水区发生2.4级地震，震源深度7千米 
                
                   
                
              
            

                  
              
                  百年前一群俄罗斯人逃到中国，成了中国一个民族，宣称中国是祖国 
                
                   
                
              
            

                  
              
                  为什么要挣钱？ 
                
                   
                
              
            

                  
              
                  爱情观不同的人，咋才能走到最后? 
                
                   
                
              
            

          

IT之家▲10的LineageOS 17.1正式发布！，基于Android 

人民网@【战“疫”说理】疫情防控中如何有效实现经济复苏？ 

『车家号』高低功率如何选？后期改装就能“低变高”了吗？，同一款发动机 

手机、眼镜如何消毒？清洁要从细节做起 

『音频』iOS如何导入百度云的音频（易剪和易剪多轨版） 

十大突破性技术-NMN，叫你如何选择最好的NMN 

妙家影视■如何计算低压开关柜铜排用量？这是我见过最漂亮的文章！ 

「史今中外s」潜伏大陆40年没被发现，结局如何？，女特务为隐藏身份嫁给农民 

【妙家影视】如何计算低压开关柜铜排用量？这是我见过最漂亮的文章！ 

「心聆寒岁」一夜带货1.6亿！如何看待直播热潮？，商场失意直播却火了