基于“LLM+Agent”的在轨服务自主任务规划技术
doi: 10.19328/j.cnki.2096‐8655.2026.01.016
李胤慷 1 , 王浩 1 , 袁容昊 1 , 王阳阳 2 , 刘晓坤 1 , 唐生勇 1 , 李爽 3
1. 上海宇航系统工程研究所,上海 201109
2. 上海航天技术研究院,上海 201109
3. 南京航空航天大学 航天学院,江苏 南京 210016
基金项目: 空间智能控制技术全国重点实验室开放基金资助项目(HTKJ2024KL502006)
Autonomous Mission Planning Technology for On-orbit Services Based on “LLM+Agent”
LI Yinkang 1 , WANG Hao 1 , YUAN Ronghao 1 , WANG Yangyang 2 , LIU Xiaokun 1 , TAN Shengyong 1 , LI Shuang 3
1. Shanghai Aerospace System Engineering Institute, Shanghai 201109, China
2. Shanghai Academy of Spaceflight Technology, Shanghai 201109, China
3. School of Astronautics, Nanjing University of Aeronautics and Astronautics, Nanjing 210016, Jiangsu, China
摘要
针对传统在轨服务任务规划中“人在回路”模式存在的决策链条冗长、人工干预依赖度高等瓶颈问题,本文提出一种基于“LLM+Agent”的自主任务规划方法。首先,构建了基于“LLM+Agent”的智能体决策架构,实现大模型语义理解与算法工具集精确计算的深度协同;在此基础上,设计了基于模型上下文协议(MCP)的异构模型交互框架,实现大模型异构算法工具间的高效数据流转与系统的灵活拓展;随后,基于在轨服务通用任务规划算法,建立了标准化 MCP 服务算法工具集,并设计面向空间在轨服务任务语义的提示模板,从而提升大模型规划可靠性;最后,通过从任务指令解析到执行反馈的闭环测试,验证了所提出的技术能够实现在轨服务自主任务规划,并提高任务决策效率。
Abstract
Aiming at the bottleneck problems such as lengthy decision-making chains and high dependence on manual intervention in the “human-in-the-loop” mode of traditional on-orbit service mission planning,this paper proposes an autonomous mission planning method based on “large language model (LLM)+agent”. First,an agent decision-making architecture based on “LLM+agent” is constructed to realize the deep collaboration between the semantic understanding of LLM and the accurate calculation of algorithm toolkits. Second,a heterogeneous model interaction framework based on the model context protocol (MCP)is designed to achieve efficient data flow between the LLM and heterogeneous algorithm tools as well as flexible system expansion.Third,a standardized MCP service algorithm toolkit is established based on general on-orbit service mission planning algorithms,and a prompt template oriented to the semantics of space on-orbit service missions is designed to improve the planning reliability of the large model. Finally,through closed-loop tests from task instruction parsing to execution feedback,it is verified that the proposed technology can realize autonomous mission planning for on-orbit services and improve the efficiency of task decision-making.
0 引言
随着航天技术的不断发展,当前航天器的设计日益复杂、价值持续攀升,一旦在轨高价值航天器失效,将带来巨大的经济损失[1-2]。在轨服务通过故障修复、燃料补加和功能升级等手段,不仅大幅降低高价值资产失效带来的经济风险,更能延长任务周期、优化资源投入,成为保障太空经济可持续性的核心支撑[3-4]。典型的单个航天器在轨服务流程可以概括为 5个关键阶段,即:轨道接近(Rendezvous)、目标识别与状态评估(Identification)、协同位姿保持(Station-keeping)、对接捕获(Capture)及在轨维护(Maintenance)[5],本文主要针对前 3个阶段中的轨道任务规划问题开展研究。
根据与目标相对距离的不同,在轨服务任务可以分为远距离抵近、近距离抵近与超近程抵近 3 个阶段[6]。以上各阶段需根据任务目标与约束条件的不同,设计定制化的任务规划策略。此外,各阶段间也涉及到复杂的交班问题[7]。远距离抵近是指航天器从数十公里抵近到目标数公里处,此时仅有目标的测角信息,航天器多采用地面引导与星上仅测角导航的方式,利用多脉冲制导等方法,完成对目标的自主接近[8]。近距离抵近则是指航天器从数公里抵近到目标数百米处,此时目标具备测角测距信息,采用星上自主导航方式,利用 C-W 制导等手段实现抵近任务规划[9]。超近程抵近则是指从目标数百米到与目标交会的过程,需要采用实时闭环控制的方法完成高精度轨道控制[10][11]。当前,工程中通常采用“地面测定轨+遥测下传→情况判定→决策规划→上注指令→在轨执行”的“星地大回路”决策模式[12]。这种“人在回路”模式依赖人工经验进行多阶段任务分解与资源调配,决策链条冗长且响应延迟高,难以实现实时决策。上述因素造成当前单次在轨服务任务地面支持时长普遍在十余个小时,严重制约在轨服务任务执行效率[13]。针对当前决策模式存在的不足,本文拟通过引入先进的大模型(Large Language Model,LLM)技术,构建新型决策框架,提升在轨服务任务中的轨道任务规划的自主化与智能化水平。
近年来,人工智能领域正在经历具有里程碑意义的技术飞跃。伴随着 DeepSeek-R1 大模型[14]的出现,标志着我国在大模型领域已经走在了世界前列。基于大模型强大的认知与推理能力,构建智能决策系统,实现对复杂任务的智能规划处理,是当前具身智能、军事指挥控制等领域的前沿研究热点。LI等[15]基于开源视觉语言模型构建了机器人操作框架 RoboFlamingo。该框架创新性地将视觉语言理解与机器人动作生成解耦,通过引入视觉编码器、特征融合解码器和可扩展策略头的三级架构,有效解决了传统视觉语言模型在动态时序控制任务中的适配难题。试验表明,该框架能够通过低成本微调实现语言指令驱动的复杂机器人控制任务。TIMO 等[16]基于大语言模型提出了 Toolformer 语言模型增强框架。通过集成外部工具应用程序编程接口(Application Programming Interface,API),能够显著提升模型在算术、事实检索及多语言处理等基础任务上的性能。Significant-Gravitas 团队[17-18]基于OpenAI 的 GPT-4 语言模型构建了 AutoGPT 框架,能够通过自主任务分解与多工具协同实现复杂目标的全流程自动化,最终给出合理解决方案。在军事应用领域,孙煦云等[19]从智能化作战的角度具体论述了大模型在作战 OODA 各环节的应用前景,并总结了大模型军事化应用的优势与面临的现实挑战。黄成琪等[20]针对多武器对多目标的任务筹划问题,基于大模型技术提出了大小模型级联的协同推理方法,能够利用大模型快速整合战场信息并调用小模型完成高效计算,有效提高了任务筹划决策的效率与准确性。Palantir 公司发布了大模型驱动的人工智能平台(Artificial Intelligence Platform,AIP),在其演示的指挥控制应用案例中,AIP 能够从数据分析、态势理解、作战筹划、任务规划等方面为指挥员指挥决策提供全流程支撑[21]。除此以外,还有学者积极探索了大模型在任务规划与智能博弈领域的赋能应用[22-25],由此可见,利用大模型实现复杂任务的自主规划决策,对于构建新一代智能决策系统、全面提升其决策效率与准确性,具有巨大的应用潜力与研究价值。
此外,在无人系统感知与决策领域,大模型也已经得到了广泛应用。在无人机领域,刘家铭等[26]对当前无人机感知领域的主要技术途径进行了梳理,并从目标检测与跟踪、环境感知与空间建模、场景语义理解与动态态势感知、预测等方面总结了大模型赋能无人系统感知的具体应用模式,揭示了大模型赋能无人系统感知的巨大潜力。侯西倩等[27]梳理了空战指挥决策领域面临的时代挑战,并从数据运用、模型训练、作战进程与自主决策等方面构思了大模型在空战决策中的赋能方式,最后提出了结合大模型、知识图谱、兵棋推演构建智能决策模型的发展建议。李婷婷等[28]针对异构无人机集群系统自主智能性不足、协同效率低、任务分配不均衡等问题,基于大语言模型提出了无人机集群任务规划系统框架,基于提示工程与规划链技术,实现了利用大模型解决复杂无人集群任务的理解、规划及执行问题。彭皓杰等[29]提出了基于大模型的空战自卫干扰策略训练优化框架,采用分层架构根据任务类型将大模型和强化学习智能体(Agent)分为顶层和底层结构,分别用于长短周期的决策任务,从而有效提升了底层强化学习模型的训练收敛性。麻玥瑄等[30]将大模型与无人机技术相结合,利用大模型为无人机提供先进的航路规划、载荷管理与行动决策,相较于传统规则式博弈决策范式,显著提升了无人机的目标识别精度、复杂环境航路规划效率及自主决策响应速度。宋哲铭等[31]面向复杂环境下无人机的指挥决策问题,设计了基于大模型辅助决策模型,借助大模型完成复杂环境的实时、准确态势感知,并辅助指挥员快速做出针对性对策,从而有效缓解了因认知偏见导致的决策偏差问题。
在无人艇领域,杨植丹等[32]基于提示工程设计了面向无人艇集群的决策架构,构建了目标感知、态势理解与决策三类智能体,通过多智能体协同方式,显著提升了无人艇集群任务中的目标识别、态势理解与自主决策控制能力。杨明哲等[33]提出了一种基于大模型的无人艇集群区域覆盖实时决策和协同控制方法,利用大模型实现自然语言命令理解与动态路径规划,显著提升了无人艇集群面向长航时任务的任务规划与异常处置能力。靳渊等[34]对当前无人艇的智能路径规划方法进行了归纳总结,分析了当前技术体系存在的人工依赖性强、动态适应性差等不足,提出了利用大模型技术提升无人艇应对复杂海况的意图预测与博弈决策能力的技术路线。张聪颖等[35]针对无人水下航行器的集群协同决策问题,提出了基于预定义提示工具的思维链框架,使大模型能够按照提示顺序给出可行的决策方案,并在多对一、多对多追逃场景下进行了测试,验证了大模型能够显著提升无人水下航行器的自主决策能力。
从上述研究可以看出,当前大模型已经在无人机、无人艇等无人系统中的任务规划与智能决策领域实现了初步应用,并展现出巨大的发展潜力。然而,在航天任务规划与决策领域,大模型的深度应用仍存在显著空白,现有应用多停留在文档编写、数据分析等辅助性工具阶段,尚未形成完整的智能决策应用范式。
综上所述,本文针对当前在轨服务决策模式存在的决策链条冗长、人工干预依赖度高等瓶颈问题,通过引入先进的大模型技术,构建了“LLM+Agent”形式的分层递进式智能处理架构,该架构以大模型为决策核心,依托大模型的语义解析能力与深度推理能力,对非标准化输入指令进行深度解构,完成意图分类与任务要素的规范化重构。在此基础上,设计了自适应调度算法,将语义单元定向传输至领域专精算法工具,例如兰伯特制导工具、C-W 制导工具等场景化功能组件,从而迅速生成精确的规划结果。系统通过模型上下文协议(Model Context Protocol,MCP)与自适应调度算法实现异构模型的有机协同,既保留基础大模型的泛化和推理优势,又充分发挥算法工具的高效精确计算特性,从而显著提高了决策效率。
1 基于“LLM+Agent”的在轨服务规划智能体总体架构设计
针对在轨服务过程中的复杂任务规划问题,为实现高效决策与推断,减小大模型幻觉与错误规划产生的概率,本文设计了一种基于“LLM+Agent”的协同推理决策架构。“LLM+Agent”架构能够为复杂的航天任务规划带来更强的灵活性和自然语言交互能力,同时在规划结果的精准度和规划耗时方面,也优于传统任务规划决策范式。在规划精度方面,尽管 LLM 本身是基于概率生成的模型,缺乏精确、复杂的计算能力,但通过调用外部算法工具,能够确保其在关键计算环节达到与传统任务规划决策范式相当的准确性与可靠性。在规划时长方面,虽然 LLM 庞大的参数量和自回归生成模式导致了较高的推理延迟,但是对于航天器自主任务规划场景,分钟级别的规划时长远远小于传统人在回路模式下的数小时至数天任务规划时长,可大幅度缩短任务规划周期。因此,大模型可以在不损失精度的情况下大幅度缩短任务规划时长,为提升航天任务规划能力提供了一种有效技术路径。
本文所设计的“LLM+Agent”协同推理决策框架如图 1 所示。该框架主要包含在轨服务智能决策大模型、轻量化仿真引擎模块、在轨服务规划算法工具集、视景展示模块等主要组成部分。通过构建层次化级联结构处理流程,将知识密集型和计算密集型任务分别交给大模型和各专业算法工具,从而实现计算资源的高效配置,并整体提高模型处理复杂任务的能力和效率。大模型与各工具之间,通过自适应调度算法与标准化异构模型交互框架紧密协作,使整个协同推理架构既具备大模型的广域认知推理能力,又兼具专业算法的计算效率与领域专长,从而形成既深又广的协同推理框架。
1 “LLM+Agent”协同推理决策架构
Fig. 1 Architecture of collaborative reasoning and decision-making based on "LLM+agent"
其中,在轨服务智能决策大模型作为整个架构的核心,通过融合任务思维链的提示工程技术进行调优后,具备对典型在轨服务任务的理解能力。该模型主要用于实现对用户顶层任务意图的理解,对复杂任务指令进行解析、全局任务分解与任务编排,并根据各子任务的需求形成结构化的任务数据,通过异构模型交互框架将任务数据精确地导向各对应的专业算法工具,实现子任务的快速、精确计算,最后由大模型进行结果汇总与组织,形成一体化任务规划方案。
规划算法工具集则包含了多个针对不同任务的特定专用任务规划算法工具,如适用于远程段抵近的兰伯特制导工具、适用于近程段抵近的 C-W 制导工具、适用于超近程抵近的实时闭环控制工具等。这些专业工具能够根据具体的子任务需求快速输出任务规划结果并反馈给大模型,满足在轨服务任务对快速响应与实时决策的需求。
轻量化仿真引擎模型具备基础的轨道递推与空间环境模拟等功能,主要用于接受来自大模型输出的任务规划方案并进行快速仿真推演,推演结果作为任务规划方案的评价依据反馈给大模型,进行方案的迭代优化,以及飞行器的状态更新,可以输出给视景展示模块进行三维视景展示,以供用户直观进行结果判读。
三维视景软件则主要用于推演结果的实时/离线展示。
在轨服务任务规划问题处理的流程如图 2所示。
2 “LLM+Agent”协同推理决策流程
Fig. 2 Flowchart of collaborative reasoning and decisionmaking based on “LLM+agent”
由 2 图可知,“LLM+Agent”协同推理的在轨服务自主任务规划主要分为 3 个关键步骤,具体介绍如下:
步骤 1  任务解构与专业算法工具适配
首先,在轨服务智能决策大模型接收用户任务指令,对输入任务进行语义解析与意图识别,如无法完成语义解析,则向用户发出无法完成任务的反馈信息;如能够完成语义解析,则进行顶层任务编排与分解,通过上下文理解生成结构化任务描述,并通过内置的专业工具使用提示模板进行子任务与专业算法工具之间的匹配,若检测到工具集存在缺项,无法覆盖全部子任务,则向用户发出无法完成任务的反馈信息;若不存在缺项,则输出带权重标注的专业算法工具调用序列。
步骤 2 任务动态编排与协同执行
随后,将大模型输出的专业算法工具调用序列输出到自适应调度器中,自适应调度器根据子任务先后顺序与依赖关系进行对应的算法工具调用,进而完成各子任务的计算工作。完成计算后,将规划结果反馈给大模型进行结果的组织与整理,并判断任务序列是否已经全部执行,若未全部执行,则返回自适应调度器进行下一个子任务;若已全部执行,则进入下一步。
步骤 3 结果组织整理与推演评估
最后,大模型对各专业算法工具反馈回来的计算结果进行组织与整理,生成最终的任务规划方案,一方面,将规划结果输入仿真引擎中进行推演验证,并将推演结果通过三维视景软件进行直观地可视化展示;另一方面,将整理后的任务规划结果组织为条理清晰的决策输出,供用户确认与评估。
2 基于 MCP 的异构模型交互框架设计
随着大规模预训练模型在专业领域的深度应用,如何高效整合领域专用算法工具集并实现模型间的协同推理成为关键挑战。传统方法多采用硬编码接口或单一模型微调,导致系统灵活性不足且难以扩展。为此,本文提出一种基于模型上下文协议(MCP)的异构模型交互框架,通过标准化接口封装算法库功能,并构建大模型与 MCP 服务的动态调用链路,实现在轨服务自主规划。如图 3 所示。该框架主要包含 MCP 主机、MCP 客户端(MCP Client)、MCP 服务器(MCP Servers)等主要组成部分。通过构建上述框架,将在轨服务客户端与结合各基础算法的多场景任务规划服务器的开发解耦,快速移植封装已有的传统算法,形成在轨服务自主规划 MCP 服务器库。
3 基于 MCP 的异构模型交互框架
Fig. 3 Framework of heterogeneous model interaction based on MCP
其中,MCP 主机是整个框架的调度中枢与资源管理中心,承担异构模型协同推理的核心控制功能。其采用分层架构设计,底层通过轻量化通信中间件实现跨节点的实时数据传输,中间层构建动态优先级任务队列,支持多模态任务的并行调度与资源管理。针对在轨服务专用算法库的差异化接口,主机通过协议解析引擎自动适配不同模型的输入/输出规范,并基于上下文感知技术动态生成模型间的数据流转路径。
MCP 客户端作为业务系统与 MCP 框架的交互入口,采用轻量化设计原则,提供标准化 API 接口封装复杂协议交互细节。客户端内置自适应通信协议栈,支持多种传输协议。在功能层面,MCP 客户端是任务发起方,实现上下文元数据的动态生成与协议转换,向 MCP 服务器提交模型调用请求并解析返回结果,并且可以管理长周期任务(如批量轨道优化),提供任务中断、结果缓存与失败重试机制,为复杂任务规划提供支持。
MCP 服务器是领域算法能力的载体,采用微服务架构实现传统算法库与大模型能力的深度融合。每个服务器实例对应特定功能模块(如远程制导、闭环控制等),内部封装算法实现细节并对外暴露标准化接口。服务器运行时加载领域专用算法插件,可实现算法分布封装开发、多机协同运行、环境系统隔离。
整个在轨服务任务规划的交互流程如下:
User Input → Claude Desktop(Host)→ Claude模型 → 需要文件信息 → MCP Client 连接 → 文件系统 MCP Server → 执行操作 → 返回结果 →Claude 生成回答 → 显示在 Claude Desktop上。
3 专业算法工具集构建
随着航天器在轨服务任务复杂度的提升,传统分散的算法模块在集成效率、跨平台兼容性以及实时性等方面面临显著挑战。本文针对跨语言、跨平台的异构算法库的整合需求,提出一种基于动态链接库(Dynamic Link Library,DLL)与微服务架构的封装范式,通过标准化接口设计、模块化服务组合及资源优化策略,构建面向在轨服务的专业算法工具集。本文以轨道动力学中的兰伯特(Lambert)问题求解算法与 C-W(Clohessy-Wiltshire)变轨算法的协同服务为例,系统阐述从算法封装到功能化服务构建的全流程方法,并通过架构揭示其技术实现路径,如图 4 所示。
4 算法工具集整体架构
Fig. 4 Overall architecture of the algorithm toolkit
图 4 可知,专业算法工具集的整体架构由算法封装层、接口适配层和服务组合层构成。在算法封装层,以 C/C++及 Matlab 等语言编写的原生算法通过标准化接口编译为动态链接库,消除语言差异性;接口适配层承担协议解析、数据标准化转换、资源动态调度及异构环境适配等关键功能,实现算法库与上层服务的解耦;服务组合层依据各个专业算法工具集的功能进行任务流程编排与算法调用规则构建,以轨道逼近任务为例,兰伯特算法负责远距离轨道转移,C-W 变轨算法负责近距离抵近绕飞,两者通过服务组合层形成链式调用逻辑。
算法封装层的核心在于将多语言实现的领域专用算法转化为统一的动态链接库。对于 C/C++算法,采用 extern “C”声明接口函数,强制规范输入输出参数的数据类型与顺序。例如,兰伯特求解器被封装为接收双精度数组形式的初始与目标位置向量、转移时间等参数,并返回速度增量结果。这一设计使得调用方无需关注内部实现细节,仅需通过标准化接口传递数据。Matlab 算法的封装则面临更高的复杂性:针对实时性要求较低的后处理算法,可通过 Matlab Coder 将脚本转换为 C 代码并编译为 DLL;而对于需保留 Matlab 特性的控制算法,则通过 Mex 接口构建适配层,使 Matlab 函数能够以 DLL 形式嵌入主程序框架。
接口协议层的核心在于连接底层算法库与上层服务。在协议解析与转换方面,针对不同算法库的输入/输出协议差异,设计统一的协议解析引擎。适配层内置协议转换器,自动识别数据源格式并转换为内部统一表示,确保跨语言调用的语义一致性。在数据标准化与校验方面,构建领域专用数据规范,强制统一坐标系、时间基准、经典物理量等单位,确保算法之间无缝交互。在资源动态调度方面,适当进行并行计算规划,提升计算效率。在异常处理方面,设置错误检测与异常处理机制,避免运行过程中由于输入类型异常、数值边界异常等因素导致程序卡死崩溃,提升在轨服务自主规划模型的稳定性。
服务组合层的核心目标是将原子化的算法库按任务需求编排为功能化的 MCP 服务。如图 2 所示,该过程涵盖服务注册、流程编排与运行时执行 3个阶段。首先,封装完成的 DLL 在 MCP 服务注册中心提交元数据,包括功能描述、输入输出格式、资源需求(如 GPU 显存、实时性等级)等。随后,通过任务分解,构建算法流程编排逻辑。例如,轨道逼近任务可定义为“兰伯特求解→坐标转换→C-W 控制”的三步链式调用,并设置转移时间、相对距离阈值等作为分支条件。
在运行时,任务调度器根据任务编排结果加载DLL 并执行算法。中间结果通过共享内存或消息队列传递。以兰伯特算法与 C-W 变轨算法的协同为例,兰伯特输出的速度增量暂存,C-W 控制器直接读取该数据并计算控制指令。设置算法调用保护机制,确保任务连续性。
4 仿真分析
为验证所设计的基于“LLM+Agent”的自主任务规划方法在复杂在轨服务问题下调用专业工具进行任务规划的效果,以典型的在轨服务任务需求设计了仿真实验,任务场景为地球同步轨道上的 G星对 D 星开展在轨服务,需要从距离 D 星后方接近百公里范围内,逐步抵近至 10 km 左右,并最终形成自然绕飞观测。仿真场景的初值设定见表 1
将任务需求与场景初值给到大模型,要求其给出任务全流程的任务规划方案,仿真结果如图 5~图 12 所示。
1 仿真场景设置
Tab. 1 Simulation scenario setup
5 大模型解析用户输入任务需求
Fig. 5 Illustration of understanding a user’s input mission with the LLM
6 大模型生成 1 阶段抵近方案
Fig. 6 The first-stage approaching scheme generated by the LLM
7 大模型生成 2 阶段抵近方案
Fig. 7 The second-stage approaching scheme generated by the LLM
8 大模型生成自然绕飞方案
Fig. 8 A natural fly-around trajectory planning scheme generated by the LLM
9 大模型生成任务总结报告
Fig. 9 A task summary report generated by the LLM
10 1 阶段抵近方案视景展示
Fig. 10 Visualization of the first-stage approaching scheme
11 2 阶段抵近方案视景展示
Fig. 11 Visualization of the second-stage approaching scheme
12 自然绕飞方案视景展示
Fig. 12 Visualization of the natural fly-around trajectory planning scheme
图 5 可知,大模型进行任务理解的过程,可以看到用户输入“帮我生成一份 G 星抵近 D 星后方10 km,然后 G 星对 D 星进行 3 h 绕飞的方案”,此时,大模型首先从数据库中查询到 D 星与 G 星的轨道根数,并通过相对关系计算,对初始场景进行理解。
在此基础上,大模型首先查询了 MCP 服务器中的工具列表,根据任务编排结果选取合适的专业算法工具,提炼工具所需的输入参数,利用自适应调度器完成工具的顺序调用,最终形成了多阶段的任务规划方案,如图 6~图 8 所示。
图 6 中展示了大模型在 100 km 距离抵近段决策 G 星采用 Lambert 制导的方式首先抵近到 D 星后方 30 km 处,并通过调用专用的 Lambert 制导算法工具得到了相应的变轨速度增量。此后,大模型进一步决策 G 星采用 C-W 制导的近程抵近方式到达D 星后方 10 km 处,并调用工具计算出了相应的变轨速度增量,如图 7 所示。然后,大模型决策 G 星进入 D 星的自然绕飞轨道,并计算出了建立自然绕飞所需的速度增量,如图 8 所示。最后,大模型对全流程的任务规划方案进行总结,如图 9 所示。
此后,大模型将上述方案推送给仿真引擎进行递推并通过视景进行实时呈现,如图 10~图 12 所示。由图 10~图 12 可知,G 星初始位于 D 星同轨道后方 100 km 处,首先进行了 Lambert 变轨,到达了 D星后方 30 km 处,随后进行了 C-W 变轨,到达了 D后方 10 km 处,最后进行了一次变轨进入了 D 星的自然绕飞轨道,符合所提出的任务需求,验证了大模型生成任务规划方案的正确性。
5 结束语
本文提出了一种基于“LLM+Agent”的自主任务规划方法,针对复杂的在轨服务任务规划问题,能够利用大模型在分钟级的时间内快速生成全流程任务规划方案,相较于传统人工设计模式效率得到大幅提升。数值仿真验证了所设计的自主任务规划方法能够准确理解用户任务意图,正确完成任务分解、任务编排与专业算法工具调用,最终给出正确的全流程任务规划方案。本文提出的自主任务规划方法开创了利用大模型进行航天器智能决策任务的新范式,在航天领域具有广泛的应用前景,能够显著降低地面管控人员的操作负荷。
1 “LLM+Agent”协同推理决策架构
Fig. 1 Architecture of collaborative reasoning and decision-making based on "LLM+agent"
2 “LLM+Agent”协同推理决策流程
Fig. 2 Flowchart of collaborative reasoning and decisionmaking based on “LLM+agent”
3 基于 MCP 的异构模型交互框架
Fig. 3 Framework of heterogeneous model interaction based on MCP
4 算法工具集整体架构
Fig. 4 Overall architecture of the algorithm toolkit
5 大模型解析用户输入任务需求
Fig. 5 Illustration of understanding a user’s input mission with the LLM
6 大模型生成 1 阶段抵近方案
Fig. 6 The first-stage approaching scheme generated by the LLM
7 大模型生成 2 阶段抵近方案
Fig. 7 The second-stage approaching scheme generated by the LLM
8 大模型生成自然绕飞方案
Fig. 8 A natural fly-around trajectory planning scheme generated by the LLM
9 大模型生成任务总结报告
Fig. 9 A task summary report generated by the LLM
10 1 阶段抵近方案视景展示
Fig. 10 Visualization of the first-stage approaching scheme
11 2 阶段抵近方案视景展示
Fig. 11 Visualization of the second-stage approaching scheme
12 自然绕飞方案视景展示
Fig. 12 Visualization of the natural fly-around trajectory planning scheme
1 仿真场景设置
Tab. 1 Simulation scenario setup
王涛. 面向执行器故障航天器的相关姿轨控制方法研究[D]. 哈尔滨: 哈尔滨工业大学, 2022.
WANG T. Attitude and orbit control for spacecrafts with actuator failures[D]. Harbin: Harbin Institute of Technology, 2022.
郑鑫宇, 曹栋栋, 唐佩佳, 等. 高轨航天器集群在轨服务智能任务规划方法[J]. 中国空间科学技术(中英文), 2025, 45(1): 34-45.
ZHENG X Y, CAO D D, TANG P J, et al. Intelligent mission planning method for on-orbit service of highorbit spacecraft cluster[J]. Chinese Space Science and Technology (Chinese & English), 2025, 45(1): 34-45.
于登云, 刘育强, 王典军, 等. 航天器在轨维修维护技术发展现状与展望[J]. 宇航学报, 2025, 46(8): 1483-1500.
YU D Y, LIU Y Q, WANG D J, et al. Development and prospects of on-orbit maintenance and repair technologies in space[J]. Journal of Astronautics, 2025, 46(8): 1483-1500.
蔡映凯, 曾鸿, 王海明, 等. 复杂约束下服务航天器抵近机动智能控制方法[J]. 中国科学: 物理学力学天文学, 2025, 55(2): 107-124.
CAI Y K, ZENG H, WANG H M, et al. An intelligent control method for servicing spacecraft approach maneuvers under complex constraints[J]. Science China: Physics, Mechanics & Astronomy, 2025, 55(2): 107-124.
王兆龙, 朱文山, 牟金震, 等. 多航天器协同观测的空间目标状态估计研究进展[J]. 中国科学: 物理学力学天文学, 2025, 55(2): 23-43.
WANG Z L, ZHU W S, MU J Z, et al. An overview of the state estimation for space non-cooperative target with multispacecraft cooperative observation[J]. Science China: Physics, Mechanics & Astronomy, 2025, 55(2): 23-43.
刘付成, 韩飞, 孙玥, 等. 在轨服务航天器的制导、导航与控制关键技术[J]. 中国惯性技术学报, 2023, 31(9): 849-860, 869.
LIU F C, HAN F, SUN Y. Key technologies of guidance, navigation and control for on orbit service spacecraft[J]. Journal of Chinese Inertial Technology, 2023, 31(9): 849-860, 869.
李革非, 李皓皓, 盛庆轩, 等. 伴飞精准驻留的轨道控制路径优化方法[J]. 航天技术与工程学报, 2025, 2(2): 74-82.
LI G F, LI H H, SHENG Q X, et al. Optimization method for orbit control path with precise stay in companion flight[J]. Journal of Space Technology and Engineering, 2025, 2(2): 74-82.
赵建磊. 空间飞行器抵近威胁分析与对策研究[D]. 长沙: 国防科技大学, 2021.
ZHAO J L. Threats assessment and countermeasures design on approaching spacecrafts [D]. Changsha: National University of Defense Technology, 2021.
武海雷, 韩飞, 孙玥, 等. 基于 GA-SQP 的航天器顺光抢位序贯博弈方法[J]. 中国科学: 物理学力学天文学, 2025, 55(9): 106-123.
WU H L, HAN F, SUN Y, et al. Sequential game method for spacecraft sunlight slot capture based on GA-SQP[J]. Science China: Physics, Mechanics & Astronomy, 2025, 55(9): 106-123.
陈瑛. 航天器交会与接近操作采样运动规划与控制[D]. 哈尔滨: 哈尔滨工业大学, 2020.
CHEN Y. RRT-based trajectory planning and control for spacecraft autonomous rendezvous and proximity operations[D]. Harbin: Harbin Institute of Technology, 2020.
韩飞. 空间非合作漂旋目标的逼近与跟踪控制[D]. 哈尔滨: 哈尔滨工业大学, 2018.
HAN F. Control method for approaching and tracking the non-cooperative floating and tumbling target in space[D]. Harbin: Harbin Institute of Technology, 2018.
袁利. 面向不确定环境的航天器智能自主控制技术[J]. 宇航学报, 2021, 42(7): 839-849.
YUAN L. Spacecraft intelligent autonomous control technology toward uncertain environment[J]. Journal of Astronautics, 2021, 42(7): 839-849.
李京涛, 许焕宾, 翟筱羿, 等. 基于空间站平台的机器人在轨服务系统架构研究[J]. 机器人技术与应用, 2021(2): 45-48.
LI J T, XU H B, ZHAI X Y, et al. Research on the inspace service system architecture of robots based on space station platforms [J]. Robot Technique and Application, 2021(2): 45-48.
GUO D, YANG D, ZHANG H, et al. Deepseek-R1: incentivizing reasoning capability in LLMS via reinforcement learning[EB/OL]. (2025-01-22)[2025-10-30]. https://arxiv.org/abs/2501.12948.
LI X, LIU M, ZHANG H, et al. Vision-language foundation models as effective robot imitators[EB/OL]. (2023-11-02)[2025-10-30]. https://arxiv.org/abs/2311.01378.
SCHICK T, DWIVEDI-YU J, DESSÌ R, et al. Toolformer: language models can teach themselves to use tools[EB/OL]. (2023-02-09)[2025-10-30]. https://arxiv.org/abs/2302.04761.
MEHMET F, KULELI S. What if GPT4 became autonomous: the auto-GPT project and use cases[J]. Journal of Emerging Computer Technologies, 2023, 3(1): 1-6.
YANG H, YUE S, HE Y. Auto-GPT for online decision making: benchmarks and additional opinions [EB/OL]. (2023-06-04)[2025-10-30]. https://arxiv.org/abs/2306.02224.
孙煦云, 姚伟. 面向智能化作战的大模型技术应用探索[J]. 指挥信息系统与技术, 2024, 15(6): 28-35.
SUN X Y, YAO W. Exploration of large model technology application for intelligent operations[J]. Command Information System and Technology, 2024, 15(6): 28-35.
黄成琪, 梁文谦, 张勇, 等. 大小模型协同推理在阵地部署和火力分配中的应用[C]//首届全国大模型与决策智能大会. 杭州: 中国指挥与控制学会, 2024: 54-62.
HUANG C Q, LIANG W Q, ZHANG Y, et al. Application of collaborative reasoning between large and small models in position deployment and firepower distribution[C]//The First China Conference on Large Foundation Model and Decision Intelligence. Hangzhou: Chinese Institute of Command and Control, 2024: 54-62.
PALANTIR INC. Deploying full spectrum AI in days with AIP bootcamps[EB/OL]. (2023-10-12)[2024-06-17]. https://www.palantir.com/platforms/aip/.
秦龙, 武万森, 刘丹, 等. 基于大语言模型的复杂任务自主规划处理框架[J]. 自动化学报, 2024, 50(4): 862-872.
QIN L, WU W S, LIU D, et al. Autonomous planning and processing framework for complex tasks based on large language models[J]. Acta Automatica Sinica, 2024, 50(4): 862-872.
罗俊仁, 张万鹏, 苏炯铭, 等. 面向智能博弈的决策 Transformer方法综述[J]. 指挥与控制学报, 2023, 9(1): 9-22.
LUO J R, ZHANG W P, SU J M, et al. On Decisionmaking transformer methods for intelligent gaming[J]. Journal of Command and Control, 2023, 9(1): 9-22.
谷学强, 罗俊仁, 周棪忠, 等. 智能博弈决策大模型智能体技术综述[J]. 系统仿真学报, 2025, 37(5): 1142-1157.
GU X Q, LUO J R, ZHOU Y Z, et al. Survey on large language agent technologies for intelligent game theoretic decision-making [J]. Journal of System Simulation, 2025, 37(5): 1142-1157.
周棪忠, 罗俊仁, 谷学强, 等. 大语言模型视角下的智能规划方法综述[J]. 系统仿真学报, 2025, 37(4): 823-844.
ZHOU Y Z, LUO J R, GU X Q, et al. Survey on intelligent planning methods from large language models perspective [J]. Journal of System Simulation, 2025, 37(4): 823-844.
刘家铭, 许帆, 李伟尧, 等. 基于大模型的无人系统感知技术综述[J]. 无人系统技术, 2025, 8(3): 1-22.
LIU J M, XU F, LI W Y, et al. Unmanned system perception technology based on large model: A survey[J]. Unmanned Systems Technology, 2025, 8(3): 1-22.
侯西倩, 葛亚维, 魏建强. 大模型时代下的智能空战指挥决策问题[J]. 指挥与控制学报, 2025, 11(2): 248-252.
HOU X Q, GE Y X, WEI J Q. Intelligent air warfare command decision-making in large language models era[J]. Journal of Command and Control, 2025, 11(2): 248-252.
李婷婷, 王琪, 王嘉康, 等. SWARM-LLM: 基于大语言模型的无人集群任务规划系统[J]. 计算机科学, 2025, 52(1): 72-79.
LI T T, WANG Q, WANG J K, et al. SWARM-LLM: an unmanned swarm task planning system based on large language models[J]. Computer Science, 2025, 52(1): 72-79.
彭皓杰, 张文宇, 陈锐海, 等. 大语言模型驱动的空战自卫干扰策略训练优化[J]. 探测与控制学报, 2025, 47(2): 71-81.
PENG H J, ZHANG W Y, CHEN R H, et al. Optimization of air combat self-defense jamming strategy training driven by large language models[J]. Journal of Detection & Control, 2025, 47(2): 71-81.
麻玥瑄, 齐家悦, 朱威禹. 大模型赋能无人机博弈对抗研究[J]. 空天技术, 2025, (3): 79-96.
MA Y X, QI J Y, ZHU W Y. Large models empower research on UAV game confrontation[J]. Aerospace Technology, 2025, (3): 79-96.
宋哲铭, 夏利锋, 李维皓, 等. 无人环境下基于大模型的辅助决策生成技术[J]. 网络安全与数据治理, 2025, 44 (增刊 1): 60-69.
SONG Z M, XIA L F, LI W H, et al. Decision support generation technology based on large models in unmanned environments[J]. Cyber Security And Data Governance, 2025, 44(S1): 60-69.
杨植丹, 乔煜焜, 宋明峰, 等. 基于提示工程的无人艇集群大语言模型决策架构[EB/OL]. (2025-10-23) [2025-10-30]. https://doi. org/10. 19693/j. issn. 1673-3185. 04592.
YANG Z D, QIAO Y K, SONG M F, et al. A decision architecture for large language model of unmanned surface vessel swarm based on prompt engineering[EB/OL]. (2025-10-23) [2025-10-30]. https://doi.org/10.19693/j.issn.1673-3185.04592.
杨明哲, 潘鹿鹿, 王鹏, 等. 大模型赋能的无人艇集群区域覆盖实时决策方法[EB/OL]. (2025-09-19)[2025-10-30]. https://doi. org/10. 19693/j. issn. 1673-3185. 04461.
YANG M Z, PAN L L, WANG P, et al. A real-time decision-making method for USV swarm area coverage empowered by large language model[EB/OL]. (2025-09-19) [2025-10-30]. https://doi.org/10.19693/j.issn.1673-3185.04461.
靳渊, 楼建坤, 王鸿东, 等. 无人船舶局部路径规划算法综述[J]. 船舶, 2025, 36(3): 10-22.
JIN Y, LOU J K, WANG H D, et al. A review of local path planning algorithms for unmanned ships[J]. Ship & Boat, 2025, 36(3): 10-22.
张聪颖, 杜长坤, 边有钢, 等. 基于 LLM 的多 AUV 协同围捕决策[C]//第十二届中国指挥控制大会. 北京: 中国指挥与控制学会, 2024: 616-620.
ZHANG C Y, DU C K, BIAN Y G, et al. LLM-based cooperative decision for multi-AUV encirclement[C]//The 12th China Conference on Command and Control. Beijing: Chinese Institute of Command and Control, 2024: 616-620.