用户名: 密码:    忘记密码   注册   在线充值
基于中英文混合词典的语音识别方法及装置  
 【申请号】  CN201710317337.9  【申请日】  2017-05-04
 【公开号】  CN107195295A  【公开日】  2017-09-22
 【申请人】  百度在线网络技术(北京)有限公司  【地址】  100085 北京市海淀区上地十街10号百度大厦三层
 【共同申请人】  
 【发明人】  李先刚;张雪薇
 【国际申请】    【国际公布】  
 【进入国家日期】  
 【专利代理机构】  北京清亦华知识产权代理事务所(普通合伙) 11201  【代理人】  宋合成
 【分案原申请号】  
 【国省代码】  11
 【摘要】  本发明提出一种基于中英文混合词典的语音识别方法及装置,其中,方法包括:获取国际音标IPA标注的中英文混合词典,中英文混合词典包括:中文词典和经过中式英语修正的英文词典;将中英文混合词典作为训练词典,以一层卷积神经网络CNN加上五层时间递归神经网络LSTM为模型,以国际音标的状态为目标,以联结主义时间分类器CTC为训练准则对模型进行训练,得到训练后的CTC声学模型;结合训练后的CTC声学模型对中英文混合语言进行语音识别。本实施例中,采用包括中文词典和经过中式英语修正的英文词典的中英文混合词典进行训练,其中英文单词覆盖全面且能识别中式英文,结合CTC声学模型的使用进一步提高了中英文混合语言识别的准确度。
 【主权项】  一种基于中英文混合词典的语音识别方法,其特征在于,包括:获取国际音标IPA标注的中英文混合词典,所述中英文混合词典包括:中文词典和经过中式英语修正的英文词典;将所述中英文混合词典作为训练词典,以一层卷积神经网络CNN加上五层时间递归神经网络LSTM为模型,以国际音标的状态为目标,以联结主义时间分类器CTC为训练准则对所述模型进行训练,得到训练后的CTC声学模型;结合训练后的CTC声学模型对中英文混合语言进行语音识别。
 【页数】  21
 【主分类号】  G10L15/00
 【专利分类号】  G10L15/00;G10L15/06;G10L15/16
   推荐下载阅读CAJ格式全文 查询法律状态
(不支持迅雷等加速下载工具,请取消加速工具后下载。)

 


专利产出状态分析  
本领域科技成果与标准  
发明人发表文献
申请机构(个人)发表文献
本专利研制背景
本专利应用动态
所涉核心技术研究动态
京 ICP 证 040431 号 网络出版服务许可证 (总)网出证(京)字第 271 号经营性网站备案信息 京公网安备 11010802020460 号
© 2010-2017 中国知网(CNKI) 《中国学术期刊(光盘版)》电子杂志社有限公司 KDN 平台基础技术由 KBASE 11.0 提供
服务热线:400-810-9888 订卡热线:800-810-6613
在线咨询:http://help.cnki.net 客服中心:http://service.cnki.net 电子邮件:help@cnki.net
可信网站 诚信网站