用户名: 密码:    忘记密码   注册   在线充值
基于策略梯度学习法的模型参数修正方法及其应用  
 【申请号】  CN201610841970.3  【申请日】  2016-09-22
 【公开号】  CN106292288A  【公开日】  2017-01-04
 【申请人】  同济大学  【地址】  200092 上海市杨浦区四平路1239号
 【共同申请人】  
 【发明人】  陈启军;刘成菊;宁静
 【国际申请】    【国际公布】  
 【进入国家日期】  
 【专利代理机构】  上海科盛知识产权代理有限公司 31225  【代理人】  赵志远
 【分案原申请号】  
 【国省代码】  31
 【摘要】  本发明涉及基于策略梯度学习法的模型参数修正方法及其应用,该模型参数修正方法包括以下步骤:S1:选择倒立摆输入参数和机器人躯干姿态参数为修正量,建立修正量的模型参数修正方程;S2:选择机器人质心跟踪的误差以及机器人姿态相对于身体直立状态的误差作为机器人对当前环境的适应度指标,建立适应度评价函数;S3:根据适应度评价函数,利用策略梯度学习法优化模型参数修正方程中的增益系数,将优化后的增益参数代入模型参数修正方程得到修正量。与现有技术相比,本发明策略方程收敛快速,机器人能在未知的扰动下快速、实时地调节步态和身体姿态,提高了机器人行走的自适应性和鲁棒性。
 【主权项】  基于策略梯度学习法的模型参数修正方法,其特征在于,包括以下步骤:S1:选择倒立摆输入参数和机器人躯干姿态参数为修正量,建立修正量的模型参数修正方程,所述模型参数修正方程内包含待优化的增益系数;S2:选择机器人质心跟踪的误差以及机器人身体姿态相对于直立状态的误差作为机器人对当前环境的适应度指标,建立适应度评价函数;S3:根据适应度评价函数,利用策略梯度学习法优化模型参数修正方程中的增益系数,将优化后的增益参数代入模型参数修正方程得到修正量。
 【页数】  14
 【主分类号】  G05B13/04
 【专利分类号】  G05B13/04
   推荐下载阅读CAJ格式全文 查询法律状态
(不支持迅雷等加速下载工具,请取消加速工具后下载。)

 


专利产出状态分析  
本领域科技成果与标准  
发明人发表文献
申请机构(个人)发表文献
本专利研制背景
本专利应用动态
所涉核心技术研究动态
京 ICP 证 040431 号 网络出版服务许可证 (总)网出证(京)字第 271 号经营性网站备案信息 京公网安备 11010802020460 号
© 2010-2017 中国知网(CNKI) 《中国学术期刊(光盘版)》电子杂志社有限公司 KDN 平台基础技术由 KBASE 11.0 提供
服务热线:400-810-9888 订卡热线:800-810-6613
在线咨询:http://help.cnki.net 客服中心:http://service.cnki.net 电子邮件:help@cnki.net
可信网站 诚信网站