用户名: 密码:    忘记密码   注册   在线充值
一种能够同时辨认英语及汉语的辨认方法  
 【申请号】  CN200810167599.2  【申请日】  2008-10-14
 【公开号】  CN101540168  【公开日】  2009-09-23
 【申请人】  黎自奋;李台珍;廖丽娟  【地址】  中国台湾台中市南区国光路85号4楼之4
 【共同申请人】  
 【发明人】  黎自奋;李台珍;黎世聪;黎世宏;廖丽娟
 【国际申请】    【国际公布】  
 【进入国家日期】  
 【专利代理机构】  北京乾诚五洲知识产权代理有限责任公司  【代理人】  付晓青;杨玉荣
 【分案原申请号】  
 【国省代码】  TW
 【摘要】  本发明能够同时辨认英语及汉语的辨认方法,本发明最重要技术 是将所有英语单字的特征完全由汉语单音的特征来抽取;对每一个英 文单字及每一个汉语单音用相同数目弹性框,抽取英语单字和汉语单 音特征;再用贝氏分类法的贝氏距离对每个已知英语单字或汉语单音 选择K个最好样本计算该已知单字或单音的真正特征;一个未知句子 分成D个英语单字或汉语单音;用贝氏分类法对每个单字或单音找F 个最相似的已知单字及单音;最后本发明用筛选方法从D×F矩阵相似 单字及单音找出该未知句子或名称,几乎所有中英语句子及名称均能 辨认正确。本发明的方法可以同时能够辨认英语及汉语,同理亦可辨 认其它外国语言,利用弹性框不管发音快慢,均能够辨认正确。
 【主权项】  1、一种能够同时辨认英语及汉语的辨认方法,所述辨认方法包 括以下步骤: (1)一个先前处理器删去不具语音音波信号点或杂音; (2)一个已知英语单字或汉语单音音波正常化及抽取特征方法:用 E个弹性框将音波正常化并转换成大小相等的线性预估编码倒频谱 (LPCC)特征矩阵,并将相同英语单字或汉语单音音波转换成大小 相同的特征矩阵,相同单字/单音音波的特征模型在相同时间位置上 有相同特征; (3)在数据库中,对每个已知英语单字或汉语单音,选择K个最 好样本; (4)一个已知英语单字或汉语单音特征矩阵的K个最好样本转换 成一个标准模型,储藏在数据库,标准模型含有该已知英语单字或汉 语单音特征矩阵的K个最好样本平均数及全部样本变异数; (5)一个未知英语单字或汉语单音音波正常化及抽取特征方法:将 音波正常化并转换成大小与已知标准模型大小相等的特征矩阵,称为 未知英语单字或汉语单音分类模型,内含有线性预估编码倒频谱; (6)一个简化贝氏分类法:将未知英语单字或汉语单音分类模型与 数据库所有已知英语单字及汉语单音标准模型比较,找一个已知英语 单字或汉语单音,它和未知英语单字或汉语单音贝式距离达最小,辨 认为未知英语单字或汉语单音; (7)建立没有样本英语单字或汉语单音特征及改进英语单字或汉 语单音特征的方法; (8)将一个未知句子或名称切成D个未知英语单字或D个未知汉 语单音方法; (9)一个简化贝式分类法在D个未知英语单字或D个未知汉语单 音中,为每一个未知英语单字或汉语单音选F个最相似的已知英语单 字及汉语单音或可能同时包含英语及汉语,一个未知句子或名称用 D×F矩阵的已知最相似英语单字及汉语单音表示; (10)用D×F矩阵的已知最相似英语单字及汉语单音,比对英语及 汉语句子及名称数据库全部句子及名称,找寻一个最可能已知句子或 名称; (11)一个建立及修正英语单字及汉语单音特征的方法,务使讲话 者的句子或名称辨认正确; (12)在本发明内,英语单字没有样本,它的特征完全由中文单音特 征计算,本发明也可以用中文单音特征计算其它任何语言特征,也可 以辨认德文、法文、俄文、日文、韩文等任何其它语言。
 【页数】  43
 【主分类号】  G10L15/00
 【专利分类号】  G10L15/00;G10L15/02;G10L15/10
   推荐下载阅读CAJ格式全文 查询法律状态
(不支持迅雷等加速下载工具,请取消加速工具后下载。)

 


专利产出状态分析  
本领域科技成果与标准  
发明人发表文献
申请机构(个人)发表文献
本专利研制背景
本专利应用动态
所涉核心技术研究动态
京 ICP 证 040431 号 网络出版服务许可证 (总)网出证(京)字第 271 号经营性网站备案信息 京公网安备 11010802020460 号
© 2010-2017 中国知网(CNKI) 《中国学术期刊(光盘版)》电子杂志社有限公司 KDN 平台基础技术由 KBASE 11.0 提供
服务热线:400-810-9888 订卡热线:800-810-6613
在线咨询:http://help.cnki.net 客服中心:http://service.cnki.net 电子邮件:help@cnki.net
可信网站 诚信网站