用户名: 密码:    忘记密码   注册   在线充值
基于领域相似性度量方法的统计机器翻译方法  
 【申请号】  CN201310689351.3  【申请日】  2013-12-16
 【公开号】  CN103631773A  【公开日】  2014-03-12
 【申请人】  哈尔滨工业大学  【地址】  150001 黑龙江省哈尔滨市南岗区西大直街92号
 【共同申请人】  
 【发明人】  曹海龙;刘淋;赵铁军;郑德权;杨沐昀;徐冰;朱聪慧
 【国际申请】    【国际公布】  
 【进入国家日期】  
 【专利代理机构】  哈尔滨市松花江专利商标事务所 23109  【代理人】  张宏威
 【分案原申请号】  
 【国省代码】  23
 【摘要】  基于领域相似性度量方法的统计机器翻译方法,涉及机器翻译技术领域。它解决了现机器翻译技术中选取平行语料的方法中,采用余弦函数与词频来作为领域间相似性的度工具并不能反应实际的相似程度以及忽略了文字背后的语义关联,而导致选取的平行语不能反映实际含义、最终影响翻译结果准确性的问题。本发明是在现有统计机器翻译方法中,在从双语平行的训练语料库中选取与翻译文本的领域相似性高的若干篇文档作为训练语料,其中判断相似性的方法为:用相对词频或主题模型作为特征代表,采用余弦距离数、变分距离函数、欧式距离函数、偏斜距离函数或者JS距离函数作为相似度函数进行档相似性度量。本发明的翻译结果更接近于人工翻译的结果。
 【主权项】  基于领域相似性度量方法的统计机器翻译方法,其特征在于,所述统计机器翻译方法为在现有统计机器翻译方法中,在从双语平行的训练语料库中选取与翻译文本的领域相似性高的若干篇文档作为训练语料。
 【页数】  9
 【主分类号】  G06F17/28
 【专利分类号】  G06F17/28;G06F17/27
   推荐下载阅读CAJ格式全文 查询法律状态
(不支持迅雷等加速下载工具,请取消加速工具后下载。)

 


专利产出状态分析  
本领域科技成果与标准  
发明人发表文献
申请机构(个人)发表文献
本专利研制背景
本专利应用动态
所涉核心技术研究动态
京 ICP 证 040431 号 网络出版服务许可证 (总)网出证(京)字第 271 号经营性网站备案信息 京公网安备 11010802020460 号
© 2010-2017 中国知网(CNKI) 《中国学术期刊(光盘版)》电子杂志社有限公司 KDN 平台基础技术由 KBASE 11.0 提供
服务热线:400-810-9888 订卡热线:800-810-6613
在线咨询:http://help.cnki.net 客服中心:http://service.cnki.net 电子邮件:help@cnki.net
可信网站 诚信网站