搜索 解放军报

从“坐等指令”到“主动出击”,看“战颅二号”制胜智能博弈场

来源:国防科大 作者:朱梦莹 李京蓓 责任编辑:李佳琦
2020-12-30 08:34:31

兵棋推演

兵棋推演被誉为导演战争的“魔术师”,指挥员可以在兵棋构建的战场上学习战争、设计战争、预判战争。兵棋推演是没有硝烟的战场,这里有千军万马、排兵布阵,更有激烈对抗的头脑风暴,这里是孕育未来战场新思想的沃土。

“红蓝双方实力对等,而不同的部署策略却使得这场海空武装对抗格外激烈精彩.......”日前,第二届全国智能博弈高峰论坛暨第四届全国兵棋推演大赛在杭州落下帷幕。我校系统工程学院牵头的NUDT-Agent团队凭借战法灵活、决策智能的智能体——“战颅二号”,以107的高分排名第一,勇夺全国兵棋推演大赛“机—机”智能博弈专项赛冠军。

与往届全部使用行动指令、控制实体作战的“人人对抗赛”“人机对抗赛”不同,本届大赛首次设置了“机—机”智能体博弈专项赛,比赛采用任务级兵棋推演平台,作战任务为海空联合攻防,红蓝双方的作战目标均为消灭敌空中、海上作战力量,同时尽可能保证己方作战单元存活。

比赛伊始,红蓝两方按照既定部署排兵布阵。双方空战兵力正面交战,火力十足。一番纠缠后,我方利用空战飞机消灭了敌方全部海战飞机,首占先机!就在这时,敌方空战飞机却抓住我方空战飞机导弹耗尽的空隙,冲着我方海战飞机的集结区域发起攻击。要知道,1架空战飞机挂载8枚导弹,而1架海战飞机只挂载2枚导弹,弹药数量悬殊,我方海战飞机有被全歼的巨大风险!“对方时机把握准确,策略调整迅速,给我们带来了较大威胁,倘若没有提前预置智能规划算法,比赛就只能听天由命了。”关键时刻,“战颅二号”启动了联合区域防空战法,凭借驱逐舰和海战飞机组成的防御火力网,对敌方空战飞机进行了强力反击,最终以1架飞机的优势反败为胜!“高手过招,扣人心弦,这是我们经历的最为惊险的一场比赛!”团队成员张龙飞、张驭龙感叹道。

在后续对抗中,凭借战法模块间的任务调度、力量配署、任务触发,“战颅二号”一路高歌猛进,任凭对方智能体使出“绕后偷袭”“强力防守”“猛烈进攻”“诱骗导弹”等多种战法,都能精确研判态势,快速形成决策,一一击败对手。“在交战中感到‘战颅二号’战法很灵活,每一步决策都精准到位,给人一种难以攻破、难以防守的感觉。”赛后对手感慨道。

“战颅二号”是去年“战颅”智能体的最新升级版本。“这次的智能体实现了联合防空、对海攻击以及空中作战三个模块,通过模块间的组织,使智能体能够面对不同的敌人,做出不同的打法,实现敌变我变。”团队领队冯旸赫表示,今年的智能体不再是给飞机、舰船等实体下达“动作级”指令,指挥它们具体往哪个方向行动,而是凭借具有自主决策能力的智能化模型,让实体完成如巡逻、侦察、开火等“任务级”指令。经此改进,实体具备了“主观能动性”,能像人一样根据战场态势机动灵活地执行智能体下达的命令,这不仅提高了模拟战法的效率,也有助于探索更加出其不意的战法。

“战颅二号”能有如此“质”的飞跃,与团队成员采取“集智攻关”的方式对智能体进行更新迭代密不可分。“每次比赛完,我们都要集中研讨,抓紧一切时间修改完善,特别是在决赛阶段,留给我们突击准备的时间非常紧张。”这个过程中,他们在算法设计、调度逻辑设计和代码实现中反复迭代优化,有时上一秒还信心满满,一部署到对战平台时却发现了Bug,出了问题,他们非但不气馁却干劲更盛。夜以继日的研发,团队成员却丝毫不以为意。尽管攻关到很晚,第二天一大早大伙又马不停蹄赶来实验室调试代码、优化策略……在团队成员废寝忘食的奋战下,“战颅二号”快速成长,最终在全国大赛“机—机”博弈中大获全胜。

该院黄金才教授说,这次比赛,是团队多年来深耕智能指挥与控制领域的成果体现,也是促进智能博弈技术实践应用的具体抓手。“通过这次比赛,我们最大的收获是找到了任务调度方向的研究空间。打造智能化水平更高的决策智能体,是我们下一步研究的主要方向。”

副院长刘忠教授表示,要继续将数据、知识和机理很好地融合,将运筹规划和知识推理、强化学习等人工智能技术相结合,探索智能博弈的新机理,推动智能规划技术的研究落地,打造自主决策能力更强、学习能力更快、具有较强场景迁移能力的新一代智能体。