基于近端策略优化算法和Mask-TIT网络的多功能雷达干扰决策方法|||北京沫之东生物技术有限公司

11 次围观

为应对愈加智能的多功能雷达给对抗方带来的挑战，本文提出一种基于近端策略优化（Proximal policy optimization，PPO）算法和Mask-TIT（Mask-Transformer in Transformer）网络的干扰决策方法。首先，从一种现实场景出发，将干扰机与雷达的对抗场景建模为部分可观察马尔可夫决策过程（Partially observable Markov decision process，POMDP），根据雷达工作原理设计了新的状态转移函数和奖励函数，并根据多功能雷达层级模型设计了观测空间。其次，利用Transformer对序列数据的表征能力和雷达干扰样式的特点设计了一种Mask-TIT网络结构，用于构建更强大的Actor-Critic网络架构。最后，使用近端策略优化算法进行优化学习。实验结果表明，该算法较现有方法收敛所需交互数据平均减少25.6%，并且收敛后的方差显著降低。

来源出处

基于近端策略优化算法和Mask-TIT网络的多功能雷达干扰决策方法 http://sjcj.nuaa.edu.cn/sjcjycl/article/abstract/202406006

相关内容

科学家发现西瓜如何进化得这么香甜

Brain Organoids in the Study of Psychiatric Disorders

番茄糖基转移酶基因<i<SlUGT75C1-like</i<的功能研究及自然变异分析

Pig Taste Cell-Derived Organoids Synthesize Insulin

豆科植物亲缘关系研究获进展

揭开光合作用“跷跷板”的秘密

Zhong SW, Zhao MT, Shi TY, Shi H, An FY, Zhao Q, and Guo HW*, EIN3/EIL1 cooperate with PIF1 to prevent photo-oxidation and to promote greening of Arabidopsis seedlings. PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES, 106, 21431-21436. 2009.

2024 06 05 Mag Stories

北京大学生命科学学院金光生命科学大楼邓祐才设备采购项目成交公告

用于正弦波频率估计的修正I-Rife算法

移动场景下异构无线传感器网络密钥管理方法

RASSF1A在细胞自噬及凋亡中的功能

科学家发现作物光合产物运输“高速路”

基于多模态超声对比学习的肝癌诊断方法

运动应激介导线粒体DAMP对先天性免疫的调控作用研究进展

西农大发现调控豆科植物根瘤共生和磷适应新机制

Genome-wide analysis of social behaviour in context: a meta-regression approach across social domains, reporters and developmental stages

处理身体垃圾海绵靠“打喷嚏”

研究揭示猪胚胎着床过程中母胎互作新机制

Gao X, Lu FR, Zhou LJ, Dang SY, Sun LF, Li XC, Wang JW, Shi YG. Structure and Mechanism of an Amino Acid Antiporter. SCIENCE 324: 1565-1568, 2009