基于强化学习的多目标点航关联方法 |
| |
引用本文: | 丁国胜,蔡民杰.基于强化学习的多目标点航关联方法[J].指挥控制与仿真,2022(2):43-48. |
| |
作者姓名: | 丁国胜 蔡民杰 |
| |
摘 要: | 针对密集杂波环境下的多目标点迹-航迹关联问题,以强化学习(Reinforcement Learning,RL)方法为基础,提出了一种基于Q学习的多目标点迹-航迹关联方法.首先,根据整个过程中目标的运动状态,建立马尔可夫决策过程(Markov Decision Process,MDP)模型.其次,利用各状态间的相关程度构...
|
关 键 词: | 多目标点迹-航迹关联 强化学习 MDP模型 策略函数 Q表再学习 |
|
|