二自由度飞行姿态模拟器的模糊强化学习控制

任立伟, 班晓军, 吴奋, 黄显林. 二自由度飞行姿态模拟器的模糊强化学习控制[J]. 电机与控制学报, 2019, 23(11). DOI: 10.15938/j.emc.2019.11.016

引用本文:

任立伟, 班晓军, 吴奋, 黄显林. 二自由度飞行姿态模拟器的模糊强化学习控制[J]. 电机与控制学报, 2019, 23(11). DOI: 10.15938/j.emc.2019.11.016

二自由度飞行姿态模拟器的模糊强化学习控制

摘要: 针对二自由度飞行姿态模拟器的姿态稳定问题,依据强化学习中的策略迭代算法设计姿态稳定控制器。将策略迭代学习算法与多项式T-S模糊系统相结合,对控制器参数进行学习调整,实现对二自由度飞行姿态模拟器姿态稳定控制性能的优化。通过多项式T-S模糊模型对执行器的策略函数以及评价器的值函数进行逼近,建立基于多项式T-S模糊模型的执行器-评价器结构,经过策略迭代过程,学习得到最优控制器参数,使得值函数最小。通过仿真验证,证明了基于多项式TS模糊模型的执行器—评价器结构的策略迭代算法在飞行器姿态稳定控制方面的有效性。

参考文献(0)

资源附件(0)

/

下载: 全尺寸图片幻灯片

分享

用微信扫码二维码

分享至好友和朋友圈

返回