摘要
面向自主智能无人系统探测感知等未来需求,本文阐述具身雷达的概念——一种将雷达感知与平台机动、智能决策深度耦合的平台—雷达一体化自主感知系统。其核心在于革新传统雷达“固定模式、单向处理、被动感知”的体制限制,发展“感知—决策—动作”闭环的处理范式,使雷达能够主动选择探测方式、机动路径和交互策略,从而在动态目标、部分可观环境和强对抗电磁场景中实现性能提升。传统雷达多遵循按任务定制的设计思路,表现为探测模式固化、参数不可调、轨迹预设化,其信号处理链以单向数据流开环处理为主,缺乏对环境目标认知后进行自主调优能力,难以满足无人系统在复杂环境下实时建模与决策的需求。具身雷达通过将平台机动性、探测感知与智能体规划策略进行耦合,构建电磁世界模型以表征“电磁场—目标—环境—平台—雷达”动态关联,并通过交互式信息处理框架进行实时闭环反馈,从而实现探测策略与机动策略的联动优化。具身雷达基于无人系统突破具身智能感知范式,有望在复杂场景下显著提升探测效能与自主作业能力,对社会生产模式及未来无人作战体系的重塑具有重要意义。
Abstract
To address future demands such as detection and perception for autonomous intelligent unmanned systems,this paper elaborates on the concept of embodied radar—a platform-radar integrated autonomous sensing system that deeply integrates radar perception with platform mobility and intelligent decision-making.The core idea lies in breaking through the limitations of traditional radar systems characterized by “fixed-mode,unidirectional processing,and passive perception,” and advancing toward a closed-loop “perception-decision-action” paradigm.This enables the radar to actively select detection modes,maneuver paths,and interaction strategies,thereby enhancing performance in dynamic target tracking,partially observable environments,and highly contested electromagnetic scenarios.Traditional radars mostly follow a mission-specific design approach,featuring fixed detection modes,non-adjustable parameters,and predefined trajectories.Their signal processing chains are primarily open-loop with unidirectional data flow,lacking the capability for autonomous optimization based on environmental and target awareness,which makes it difficult to meet the real-time modeling and decision-making requirements of unmanned systems in complex environments.Embodied radar couples platform mobility,detection perception,and agent planning strategies,constructing an electromagnetic world model to characterize the dynamic relationships among “electromagnetic fields,targets,environment,platform,and radar.” Through an interactive information processing framework that enables real-time closed-loop feedback,it achieves joint optimization of detection and maneuver strategies. By leveraging unmanned systems to advance the paradigm of embodied intelligent perception,embodied radar is expected to significantly improve detection effectiveness and autonomous operation capabilities in complex scenarios,which holds great importance for reshaping social production modes and future unmanned combat systems.
0 引言
人工智能(Artificial Intelligence,AI)正加速与传统工程科学交叉融合,催生科学智能、工程智能等新范式。在此背景下,无人机、无人车、无人船等智能无人平台快速发展,显著提升工作效率与作业范围,引发战争形态与战术变革,成为未来社会生产与战场作战的核心力量[1-4]。其背后的关键技术之一是具身智能(Embodied Intelligence),即智能体通过传感器与环境持续交互,并利用平台机动与反馈形成闭环决策。在现有具身智能体系中,传感器通常作为感知入口,而平台动作与决策为主要执行环节。如 LeCun 团队通过结合视觉与触觉信息[5],优化“身体”与“环境”交互反馈中的 AI 决策。其中,感知仅作为具身智能的输入,辅助行动或规划决策,如图 1(a)所示,为 AI执行任务提供支撑;而本文论述的“具身感知(具身雷达)”则将传感器紧密集成到智能体的“身体”(无人平台)中,由 AI 参与传感过程,主动控制传感器(雷达)探测模式与身体(平台)运动状态,实现 AI 与传感系统的交互式协同作业,如图 1(b)所示,为感知任务提供支撑。未来随着智能无人系统的发展,传感器本身的主动性与可调性同样关键,需要从“被动感知”向“具身感知”升级,即传感器成为智能体的组成部分,可通过智能策略主动调节探测模式并协调平台机动行为。
图
1
具身智能与具身感知(具身雷达)
Fig.
1
Embodied intelligence and embodied sensing (embodied radar)
雷达作为无人系统最重要的远距时空感知手段[2],在密集无人平台、复杂电磁环境与强对抗场景中面临模式固化、环境认知缺失、决策迟滞等瓶颈,亟需从传统的按平台定制化设计探测模式向更高智能级别演进。传统雷达体制普遍以“雷达为中心”进行设计,其工作模式通常表现为平台轨迹预设、波形参数固定、信号处理链单向执行,这种静态架构难以有效应对时敏目标、信号遮挡、多径效应及动态对抗策略等复杂场景,如图 2 所示。例如,在时敏目标探测任务中,传统雷达因无法快速自适应调整观测角度与信号参数,常难以有效捕获高速机动或突发出现的目标[6];而在复杂地形环境(如山区、城市楼群)中,雷达信号易受地形遮挡与多径反射干扰,导致目标探测识别性能显著下降[7-8]。为应对复杂探测挑战,多个国内外团队提出自适应雷达[9]、多功能雷达[10-12]、认知雷达[13-17]等雷达智能化框架,其引入了对发射波形与接收功率等核心资源的实时优化能力。在此基础上,在复杂环境与弱目标远距离探测任务中,无人平台雷达逐渐展现出“控制-感知”一体化设计的独特优势。同时,AI 技术深度融入于雷达信号与数据处理之中,为上述优化与协同提供了强大的算法支撑,共同推动了雷达系统向更高层级的智能化演进。在无人平台任务驱动的背景下,构建可同时调控观测轨迹、发射策略、雷达姿态与处理链条的自主探测体系。为此,本文提出具身雷达(Embodied Radar)的概念,即一种将雷达与无人平台(身体)一体化实现具身感知的新体制雷达。
图
2
传统无人系统雷达探测模式
Fig.
2
Conventional radar detection modes for unmanned systems
具身雷达是在自适应雷达[9]、多功能雷达[10-12]、认知雷达[13-17]等雷达智能化框架的基础上,进一步结合平台机动性和雷达自适应性的设计框架,强调在路径规划与探测资源控制等维度实现系统化集成。它注重雷达与无人平台的深度耦合,使雷达能够在真实环境及其内部世界模型的指导下,自主规划探测策略并执行相应动作,从而形成具备具身智能体属性的探测系统,其代表了无人系统向全自主探测演进的路径。与现有雷达智能化框架相比,具身雷达的主要区别与联系体现在世界模型指导下的交互式闭环处理,以及是否实现路径规划与雷达探测资源的协同优化。本文试图阐述具身雷达的基本概念、相关技术的发展历程与系统架构,探讨电磁世界模型和交互式信息处理的理论基础,并展望其未来发展趋势和挑战。
1 具身雷达的基本概念
2025 年 7 月在上海召开的第二届雷达学术前沿大会发布的《2025 雷达领域十大前沿问题》中,“具身雷达:雷达自主智能探测新范式”被明确提出,“雷达系统将逐渐具备类似人类认知与交互的能力,通过与环境目标的闭环交互不断学习优化反馈适应。具身雷达强调雷达与平台一体作为具身智能体,利用雷达系统敏捷性、物理平台机动性和智能认知决策能力,使其在复杂环境中进行自主感知、认知、规划和行动,从而发展面向任务的自主智能探测新范式。”[18]概括而言,具身雷达是将雷达感知、平台机动与智能决策深度耦合,使雷达不再是被动传感器,而成为具备“感知—决策—动作”闭环能力的具身智能体。
1.1 具身雷达的基本概念
具身雷达本质上是将雷达系统与无人平台深度耦合并具备闭环处理能力的智能体,通过智能体在电磁世界模型中交互式学习,实现对复杂环境的自主理解与主动探测。智能体在获取目标与环境的感知信息后进行理解与预测,然后规控探测资源及平台的姿态与轨迹,实现探测行为与平台机动的协同优化。与“小闭环优化雷达探测资源”不同,具身雷达强调“平台与传感器的大闭环”,即探测行为不再只是对外界刺激的响应,而是主动探索与动态优化的过程。在这一过程中,雷达的每一次动作都会影响其下一次感知,从而形成连续学习与适应机制,使系统在复杂环境与对抗条件下能够长期进化,最终提升探测性能与自主能力。
1.1.1 结构与内涵
具身雷达作为一种雷达—平台一体化的闭环自主探测系统,其总体架构可抽象为由智能体—电磁世界模型—交互式学习框架 3 部分构成的具身感知系统,如图 3 所示。智能体通过特定探测模式、运动轨迹等动作感知目标与环境,感知后解译信息,衡量信息获取价值,再输出下一步动作决策,通过循环反馈实现探测信息量最优。该体系不仅强调雷达在电磁域的感知能力,同时强调其在物理域、决策域与认知域的深度耦合,这使得具身雷达区别于传统雷达和认知雷达。
图
3
具身雷达的基本架构
Fig.
3
Basic architecture of embodied radar
在具身雷达体系中,智能体是实现闭环运行的实体,可进一步分为解译智能体与规控智能体 2 个子模块:前者负责对感知数据进行解析、抽象与环境状态理解,包括目标检测识别及场景语义重构;后者负责将认知结果转化为可执行的动作策略,实现对平台轨迹、姿态及雷达波束、信号参数等探测资源的综合调控。解译智能体和规控智能体相互依存,共同决定具身雷达的行为模式:感知数据如何被解释、动作会引发怎样的环境变化、系统如何在多目标任务中进行权衡与优化等。这些功能使智能体成为具身雷达的“大脑”,主导整个闭环系统的智能水平与自适应能力。
电磁世界模型是具身雷达实现闭环认知的基础,其作用不仅限于离线仿真平台,更是在线环境理解、状态预测与策略评估的核心载体。该模型通过物理机理、统计特征及学习机制综合刻画目标环境电磁特性与雷达探测动作的复杂动态关系,包括信号传播、多径散射、遮挡结构、干扰,以及平台姿态对空间电磁散射特性的影响等。高逼真世界模型的构建直接决定智能体决策的有效性与鲁棒性,因此世界模型需具备实测数据同化能力,能够将雷达实测回波、平台机动反馈及环境变化不断融入模型中,实现对真实场景的动态逼近。
交互式学习框架则是具身雷达得以实现进化性与持续优化的动力机制,是连接智能体与世界模型的交互模式。具身雷达并非在固定模型上执行静态策略,而是在连续任务执行的过程中,通过“感知—决策—动作”的循环迭代,逐步改进自身对世界的认知及对任务的策略设计。交互式学习框架通过强化学习、模型驱动优化、自监督学习等技术,使系统具有跨时域的持续学习能力。
因此,具身雷达的内涵包括以下 3 方面。
1)解译与规控智能体设计是具身雷达的关键:智能体用于实现系统探测模式与平台路径的调控,决定感知数据如何被认知、动作后外部环境将如何响应、不同策略的代价等。
2)高逼真电磁世界模型是闭环决策的认知基座:世界模型不仅用于离线仿真,更是在线环境理解与预测的载体。世界模型的逼真性影响智能体的学习效果,因此需要具备实测数据的同化能力。
3)交互式学习框架是实现具身进化的动力机制:智能体通过连续任务执行不断改进世界模型与决策策略。因此,感知、世界模型、决策与动作之间存在双向信息流:感知结果更新世界模型、世界模型支撑预测与规划、决策结果产生动作、动作后环境状态变化反向验证模型与策略。
基于以上 3 个基本组成元素,系统内部存在多层双向信息流,包括:感知结果反向更新世界模型,纠正其对电磁环境的预测偏差;世界模型为智能体提供前瞻性的预测能力,支撑策略规划与多步骤推理;决策模块根据模型输出生成动作指令,其包括信号参数、波形优化等探测资源与平台机动调控路径规划;动作改变产生新感知数据,形成闭环验证并促进策略迭代。通过这种设计,具身雷达不再依赖预设参数或策略,而是能够通过持续交互不断调整世界模型、优化决策策略并增强体系鲁棒性,使其具备自适应性与演化能力。
综上所述,具身雷达可概括为 3 个层面:智能体设计奠定系统智能行为的基础,高逼真电磁世界模型提供认知支点,交互式学习框架赋予系统持续进化能力。三者协同构成具身雷达从“传感器”向“认知体”、从“被动响应”向“主动探测”演化的关键路径,使其能够在复杂电磁环境、强对抗条件,以及动态任务场景中实现自主、高效与智能化的探测能力。
1.1.2 主要特性
1)自主适应性:从被动响应到主动探测
具身雷达最核心的特性是自主适应能力。面对任务目标与环境条件的复杂动态变化,具身雷达能够自主调整发射波形、频率、带宽、波束指向等参数,同时可根据环境反馈重新设计探测策略。这种深度自适应能力不仅包含传统意义上的自适应滤波与波形优化,更包含对“动作—感知”整体链条的调节,使雷达能够主动选择最优的探测方式,而非被动接受固定工作模式的限制。在复杂、遮挡、多径及干扰环境中,自主适应性使具身雷达能够在任务过程中逐步优化自身策略。
2)学习能力:经验驱动的持续演化
内置认知模块,能够累积对环境和目标的认识,从历史探测数据或虚拟空间中学习规律,不断优化后续探测策略。这类似于人类通过经验提高认知决策能力,使雷达在未知环境中性能逐步增强。具身雷达内部的认知模块能够通过对过往环境和目标特征的学习,实现对未来态势的预测和推断。这种能力使雷达逐步形成一种“环境记忆”,并能从长期任务中提取规律提升决策效率。例如,在复杂城市环境中,具身雷达能够记住特定区域的遮挡结构、多径特征或敌方干扰行为,从而在后续任务中提前调整机动行为与波形设计,实现知识驱动的情境感知。学习能力使具身雷达不再依赖单次输入,而是在累积经验基础上持续演化,具备类生物智能的“学习性”。
3)物理交互性:雷达与平台的一体化表达
具身雷达不同于传统雷达,其不仅在电磁域进行调控,还具有物理空间维度的交互能力。作为无人机/无人车等平台的核心“器官”,具身雷达可以通过控制平台的机动行为改变观测几何结构,包括视角变化、基线调整、阵列形态变化等。这种“机动即感知”的理念突破了传统雷达架构,使雷达能够像动物调整身体姿态一样,通过改变物理位置与姿态促进更有效的探测感知。雷达与平台因此构成智能体的“眼睛与身体”,雷达动作与平台机动不再分离,而是形成统一的策略空间。
4)群体具身智能性:从单体智能到分布式协同
随着无人集群作战体系的发展,具身雷达的能力可以从单平台扩展至多平台协同。在群体具身雷达中,多个具身智能体通过共享或受限共享的信息,实现分布式的“感知—决策—动作”多闭环协同。可实现协同机动,构造多基线、多视角观测几何,通过任务自适应分配提高整体探测效率。群体具身雷达本质上是多个具身智能体之间的多智能体决策问题,使系统具备更高层级的智能协同性。
5)多模态融合:具身雷达向具身感知智能体扩展
广义上,具身雷达还可与其他传感器(如摄像头、激光雷达等)协同,形成多模态感知。具身智能体强调身体与环境交互,多传感器融合有助于雷达更全面地理解环境,但严格来说,多模态融合是具身智能系统特性,单论具身雷达主要指雷达传感器本身的智能化与物理交互能力。
可见,具身雷达技术延续多功能雷达、认知雷达等雷达智能化框架提出“感知—决策—动作”闭环新范式,使雷达成为具备物理交互能力、决策能力、学习能力与群体协同能力的具身智能体,通过构建高逼真世界模型、完善闭环交互架构并发展智能决策机制,具身雷达将在复杂任务环境和强对抗场景中发挥重要作用。
1.2 具身雷达的发展历程
传统雷达系统通常基于专用平台构建,其数据处理与分析高度依赖人工干预。随着中国科学院空天信息创新研究院、西安电子科技大学、北京理工大学、国防科技大学、电子科技大学、复旦大学等研究机构在智能解译方法的研究,雷达系统的智能化进程得到了有力推进。雷达技术将从以往的开环处理模式向局部闭环系统演进。未来,通过融合具身智能理论与自主化雷达设计,有望发展新一代具身雷达体系,实现从“感知”到“决策”再到“动作”的全链路闭环运作,推动雷达系统向更高层级的自主探测能力演进,如图 4 所示。
1.2.1 自适应雷达的发展
20 世纪 90 年代传感器管理(Sensor Management)框架的提出为雷达的智能化奠定了基础[19-20]。传感器管理将数据采集过程视为闭环决策问题,强调在数据采集过程中根据已获得的信息调整后续采集策略,这一阶段可称为自适应雷达,其“自适应”主要体现在雷达信号或数据处理端。加拿大 Simon Haykin 团队则通过构建环境动态数据库并引入知识辅助处理,实现了发射参数随探测环境的实时调整与最优匹配[21]。进一步结合恒虚警率处理(Constant False Alarm Rate,CFAR)、空时自适应处理(Space-time Adaptive Processing,STAP)、自适应波束形成等雷达信号处理技术的发展,从静态、预设的处理模式,转向基于实时环境感知的动态、自适应处理模式,在强干扰和杂波背景下有效提升对目标的检测能力[22-24]。其可等价表示为一个多维多约束的目标函数求解问题[22]:
图
4
具身雷达的发展路径
Fig.
4
Development path of embodied radar

(1)
式中:为在指定优化准则(Criterion)下最优波形 sk(t;θk)的近似或估计;J(θk|Ω)为目标函数,其形式通常与选取的优化准则和雷达系统实际应用任务、工作模式相关;Ω 为先验知识的集合,包括目标和环境特性等与雷达波形相关的先验知识;gk(θk)、hk(θk) 分别为波形参数的不等式约束和等式约束。
这些早期工作均体现出让雷达“自适应地”选择如何处理接收信号,是对环境变化的被动响应。当时自适应雷达缺乏统一定义,但为后来认知雷达的发展积累了大量技术储备。可以说,自适应雷达的发展体现了雷达从固定预设系统向更灵活自适应系统的过渡。
1.2.2 多功能雷达的发展