2021, 13(5):548-555.DOI: 10.13878/j.cnki.jnuist.2021.05.006
摘要:针对随机线性离散时间系统,利用Q学习算法求解无限时域的随机线性二次最优追踪控制(SLQT)问题.首先,假设通过命令生成器生成追踪所需的参考信号,并建立一个由原随机系统和参考轨迹系统组成的增广系统,把最优追踪问题转化为最优调节问题的形式.其次,为了在线求解随机系统的最优追踪问题,将随机系统转为确定性系统,并根据增广系统定义随机线性二次最优追踪控制的Q函数,在无需知道系统模型参数的情况下在线求解增广随机代数方程(GSAE).再次,证明了Q学习算法和增广随机代数方程的等价性,给出了Q学习算法实现步骤.最后,给出一个仿真实例说明Q学习算法的有效性.
地址:江苏省南京市宁六路219号 邮编:210044
联系电话:025-58731025 E-mail:nxdxb@nuist.edu.cn
南京信息工程大学学报 ® 2025 版权所有 技术支持:北京勤云科技发展有限公司