文摘
数字双正成为最有前途的新兴技术领域的无人作战和可能创新未来战斗风格。在线战场上学习是一个关键的技术支持数字双无人作战的成功应用。由于迫切需要有效的在线学习算法实时战场州,一个新的随机有限集——(RFS)算法为基础的检测不确定性包括杂波,错过了检测和噪音。系统架构和运作模式实现数字twin-enabled在线学习提供战场。使用的无人地面车辆(作出)作为系统的实验对象描述该算法。战场系统架构实现数字twin-enabled在线学习是第一,和它的运作模式也详细描述。RFS-based数字双模型包括战场状态模型,作出运动模型,设计和传感器模型。采用贝叶斯推理、概率假设密度(博士)修改滤波器来实现在线学习的过程。最后,一组进行实验验证该算法的性能和效率。本文的研究工作将提供一个良好的示范应用的数字双无人作战。
1。介绍
采用无人机带来伟大的自主权和现代战争的新技术挑战。无人驾驶车辆,如无人地面车辆(作出)蕴含着巨大的希望未来的作战行动,已经被用于在叙利亚和阿富汗最近的一些军事冲突(1- - - - - -3]。作出的车辆运行在与地面接触,没有人类的存在。如何反馈有效信息收集从真正的战场仿真空间以及如何使未来模式的好处,比如Cyber-Physical系统(独立主办)和数字的孪生兄弟,对无人作战(大挑战4- - - - - -7]。在本文中,我们使用作出作为实验对象指定我们的贡献在实现数字双胞胎在无人作战。
由于数据分离,真正的战场及其模型,很难实现自动的信息流动在一个封闭的循环。数字双提供了一个新的和有效的方法来解决这个问题。它可以实现实时双向之间的互操作性的现实世界和虚拟仿真空间,也是一个有效的方法,使有效的实时数据共享整个操作过程包括智能监控、预测,数字表示,评估,决策支持,和战场上学习8- - - - - -10]。
战场环境指的是由所有的客观因素战场除了战斗人员和武器。各种各样的作战行动都离不开特定的战场。战场上有着重要影响作战行动的过程和结果。战斗实体可以收到并提供输入输出到战场。作战实体的作战意图是通过与战场上的互动实现的。
战场上学习意味着传感实体迅速在战场上,全面了解当前形势,预测未来状态之前准确地决策(11]。战场上的学习是很重要的对于预测未来情况,评估不同动作的作战效能。战场上学习有助于改善指挥官的理解情况作为一个整体,形成决策的依据。它也是非常重要的指挥官的实时监控和感知的动态情况12]。
基于战场上学习的经典定义,在线学习战场感知的过程是一个现有的战场和预测将来会如何演变。是有用的获取知识未知的战场,而真正的战斗过程是同时进行(13]。在线战场学习也是非常重要的发电计划安全巡逻和在线决策支持(14]。
在军事模拟、计算机生成力(CGF)是虚拟作战对象由一台电脑,可以控制或指导其行动和行为的全部或部分15]。构造方法的核心任务是在战场上作战实体的行为模型。在线战场上学习是CGF的关键技术之一,具有广阔的应用前景。CGF取决于在线学习战场融合传感器产生的数据在战场上并生成在线实时战场州。
近年来,数字双已成为一个热点话题,以及各领域代表情报从军事到民生16- - - - - -19]。数字双强调虚拟对象发展的实时接收数据的物理对象,从而保持一致的物理对象在其整个仿真周期(20.,21]。从广义上讲,数字双系统组成的物理对象,仿真模型,它们之间的实时动态交互。它需要建立真正的实体的仿真模型和模拟他们的行为(22]。它被认为是核心现实和虚拟空间之间的联系。借助各种高性能的传感器和高速通信技术、数字双可以现在和预测物理实体的实际情况接近实时通过集成数据的物理实体。它能增强的能力分析和仿真和控制物理实体通过虚拟现实互动的接口和数据融合算法(23]。启用数字双无人作战的关键是理解在战场上不断发展的情况下准确和及时。
在本文中,我们重点学习的战场州由重大环境因素和作出状态。为了探索如何实现数字twin-enabled在线战场上学习,我们提出基于随机有限集——(RFS)算法可以支持实时交互,以及深度集成和虚拟和真实的战场之间的互利共生关系。它是必要的基础数字双无人作战的成功应用。我们的主要贡献是设计和实现一个新的在线战场学习算法通过使用RFS-based贝叶斯理论和修改概率假设密度(博士)过滤器24]。该算法的最重要的价值是突破数据真实和虚拟战场之间的边界,使数字双无人作战的应用。该算法可以消除信息孤岛,实现紧密集成、平等互动的真实和虚拟战场。
剩下的论文结构如下。在最近的文献综述数字双和随机有限集(RFS)节中给出2。我们提出的系统架构和运营模式提出了在线战场学习算法部分3。RFS-based战场模型,作出运动模型,介绍了传感器模型部分4。学习过程的设计和实现部分给出5。节中详细的实验结果6在部分,并给出结论7。
2。相关的工作
数字双具有重要的研究和应用价值在在线战场的每一阶段的学习。在设计和示范阶段,数字双可以帮助改善系统性能的评价功能,使得仿真系统之间的平等的双向互动和真正的系统。通过semiphysical模拟、数字双提高能够快速定位的设计缺陷,优化系统设计和测试执行在线战场学习算法的实用性。
为了应用数字战场twin-enabled在线学习在操作阶段,重要的是要认识到之间的双向交互仿真空间和现实空间。道给数字双胞胎的五维结构模型和提出了六个应用原则(25,26]。数字双的最好方法是实现真正的交互式集成空间和仿真空间和被许多学者和企业高度关注。最重要的突破在于,它不仅是一种物理世界的镜像也接受来自物理世界的实时数据和实时反过来作用于物质世界(22,27]。数字双作战仿真领域带来了新的发展机遇,因为它可以允许指挥官有一个完整的数字足迹的战场从头到尾28,29日]。实时动态交互虚拟世界和现实世界之间的基础是数字的双胞胎,以及建模与仿真的主要挑战。一些研究人员提出一个数字twin-driven制造cyber-physical系统并行控制的智能车间。通过使用分散的数字双模型,他们成功地连接网络空间和物理空间。
在线战场学习需要自主在操作阶段。分散的多重代理系统也是一个实现在线战场上学习的新方法,如区块链和方法。一些研究人员已经讨论了如何使用区块链来克服网络安全行业壁垒实现智能4.0和介绍八制造系统的网络安全问题。一些研究人员调查了区块链的能力克服障碍和检查生产系统上的文学观点和产品生命周期管理的视角。阿里等人提供的调查可替换主体系统的所有方面,从定义、特性、应用,挑战,和通信的评估。他们还做了一个分类多重代理系统上的应用程序和挑战以及进一步的研究(参考30.]。
RFS小说提供了一个统一的概率方法融合实时战场数据(31日]。传统战场学习算法通常依赖于基于矢量数据表示,无法支持实时数字的双胞胎。基于矢量的表示需要维度和元素的顺序在每个向量相等和固定。它也需要必要的操作以外的贝叶斯递归,以确保一致性的向量。新近观察到测量的决心和错过的测量是实现通过向量增加和截断计算密集型和不可逆转的。在本文中,我们提出利用随机集理论来克服这些缺点。提出RFS-based算法能够克服传统算法的局限性,因为它考虑更现实的情况随机不同数量的目标和测量,检测不确定性,假警报,协会不确定性都考虑在内。
3所示。系统架构
新兴信息技术的快速发展,如人工智能(AI),云计算,边缘计算、数字双及物联网(物联网),战斗风格也已发生深刻变化。新的信息技术促进出生,无人作战的开发和应用。正如图所示1,新的信息技术提供了更加多样化的数据源,更强大的计算能力,和更高效的计算方法对无人作战的关键活动,包括描述、诊断、预测和决策。
数字战场twin-enhanced在线学习的运作模式包括五个元素,即。、计算服务、物理实体、仿真模型连接数据,以及它们之间的连接。如图2、数字双使双向实时映射和真正的战场之间的相互作用及其仿真模型。真正的作战实体的仿真模型是用来反映和预测他们的行为在现实空间。另一方面,通过RFS-based战场州战场在线学习算法,生成的作战仿真系统可以指导军事指挥官应对形势变化和选择最优的行动方案(COA)。数字双实现闭环优化整个过程的观察,定向,并决定采取行动。数字双意味着建立数字模型的模拟方面的武器,士兵,或战场和执行所有的模型在一个集成的方式。RFS-based仿真模型是并行执行和真正的战场指挥官提供有用的知识。
战场上考虑本文包含的所有重大环境因素和作出的州。由于GPS和地形图在实战最有可能被禁用,位置和映射为无人驾驶车辆只能获得的帮助下装备传感器。战场RFS-based在线学习算法在虚拟空间中扮演着中心角色。它提供了模拟战场信息决策支持系统训练的深度学习网络系统。它还可以生成实时战场信息无人作战仿真系统,有助于评估可用农委会的可能的输出。
战斗模拟,战场上为所有参与演员提供了时空的限制。模拟战斗部署和控制对象在虚拟空间。他们学习其他战斗的战场,由对象和重要环境因素通过使用该算法。作战仿真系统在虚拟空间作为决策辅助工具,帮助指挥官来评估所有可用的弱点。它负责选择最佳的推广。提出在线战场学习算法旨在分析和理解操作活动在现实空间在给定的时间。它可以帮助作出正确的决策和预测未来的情况。它是启用的关键技术和实现数字战场twin-enabled在线学习无人作战。
对应的操作模式,数字战场twin-enabled在线学习系统架构的无人作战图所示3。运行时基础设施(RTI)采用提供模拟服务支持的互连和互操作实体在真实空间和虚拟空间的仿真模型。此系统架构使用数字双和RTI之间支持实时交互虚拟和真实的战场。通过这种方式,它可以实现深度集成和虚拟和真实的战场之间的互利共生关系。该算法可以同步学习的数量和位置的重要环境因素(或标志)在战场上存在传感器的视场(FoV)。它也有精确映射的优势,虚拟现实互动,立体感觉,聪明的干预,和其他特征。
4所示。RFS-Based仿真模型
数字twin-enabled战场建模包括三个方面。第一个是建模战场州包括线索(或标志)。第二个是作出运动建模。第三个是建模上的传感器装备作出。为了克服数据协会在高杂波和测量噪声不确定性问题,RFS-based建模方法完全协会不确定性的数据集成到战场上学习。该算法的关键是代表战场州使用RFS。仿真模型的推导过程取决于RFS。RFS是马勒的理论提出了在工程应用中实现RFS [32]。RFS-based模型是孪生与真正的实体模型,并行执行和提供新的知识真正的战场8,27]。
战场上的基于矢量的表示已被证实有一些数学的后果,如重大环境因素的排序,数据关联问题,管理问题和元素。此外,动态随机场景,如何量化学习结果的错误产生的基于矢量的贝叶斯推理也是一个巨大的挑战。通常是解决上述问题的增加或删除向量以外的贝叶斯推理过程。这将导致问题的贝叶斯最优只能达到预先定义的子集的战场。在本节中,我们给出了RFS-based模型系统可以解决这些问题。
的困难RFS-based贝叶斯推理是其计算复杂度。为了解决这个问题,马勒博士提出了(概率假设密度)过滤器。博士的后验概率密度用和是一个密度函数上定义单一对象状态 如下:
在这里,表示RFS检测收到的时间k,表示状态的RFSk。我们使用缩写 。在点理论中,被定义为强度密度。它不是一个概率密度和代表预期的密度点的数量 。给出任何子空间单一对象的状态空间 ,积分预期的数量的对象在吗 。
4.1。RFS-Based战场上表示
我们采用RFS-based战场表示;在这里,年代表示未知RFS代表整个战场。此外,为了协助运营决策,我们也与战场作出状态 。RFS ,根据作出状态是什么 在时间 ,是用来表示已经探索过的战场。RFS的战场州由重大环境因素和所有视场的联盟的交集,整个战场的状态。因此,可以表示如下:
在这里, 。 取决于作出状态时 。学会了战场的时间k可以获得基于吗在以下方式: 在哪里 即代表了未知的战场,重要环境因素的设置不了 。RFS表示学习出现在战场上第一次。因此,可以建模为战场上的过渡过程 在哪里表示的状态转换密度战场时间 ,和表示的密度RFS 。
4.2。RFS-Based作出运动模型
作出的位置可以表示为状态向量 。作出运动模型特征之间的过渡状态 和 后输入控制命令 。在本文中,我们采用以下二维平移和旋转位移运动模型:
本文的具体数学表达式采用如下:
在这里,用于表示的不确定性和噪音,然后呢 在时间的控制命令作出收到吗 。
4.3。RFS-Based传感器模型
鉴于目前作出RFS和战场RFS ,检测RFS可以描述如下:
在这里, 表示检测RFS相关重大环境线索与状态 ,和表示杂波RFS,作出相关的状态 。由于不确定性和随机性在检测过程中,元素的数量是随机的,可能不同于州的数量吗年代k。
检测RFS 由战场状态由伯努利方程建模RFS。因此,有两种形式 。第一个是 和概率是 。另一个是 和概率是 。 表示作出状态的时间 ,和 表示生成的概率检测 。 模型的可能性年代生成检测 。在这篇文章中, 如果存在重大环境信号的传感器 ,和 ,否则。
根据和 ,传感器产生的似然函数表示如下:
在这里, 的似然函数生成检测RFS吗对于RFS ,和的概率密度是杂乱RFS吗 。
本文所使用的距离和方位传感器。检测生成的二维环境线索位置可以建模如下:
在这里, 和轴承检测范围, 是提示的位置,与协方差是噪音 。
5。学习过程及其实现
在本节中,我们给出了基本原理、算法的设计和实现。顺序的过程中该算法依赖于传播的联合后验概率密度RFS-based战场和作出状态作为检测到。
5.1。RFS-Based学习过程
RFS-based战场建模,RFS-based贝叶斯推理用于共同学习环境因素的位置在每个时间步和作出状态。战场RFS可以描述如下:
在本文中,我们使用 表示和战场上的预测分布状态 表示战场上的后验分布状态。战场上的知识可以传播预测和更新过程如下:(我)预测战场状态通过使用前面的战场状态和输入参数: (2)更新战场状态取决于收到检测RFS :
在这里,意味着集成。
摘要博士过滤器是用来实现RFS-based贝叶斯递归(24,33- - - - - -35]。我们修改和扩展高斯mixture-based博士粒子滤波的滤波器。高斯混合滤波器应用于博士学习环境因素的数量和位置,以及粒子滤波应用于作出状态同时学习。计算过程的在线战场学习通过修改博士过滤器如图4。贝叶斯递归封装固有的不确定性的重要环境因素的数量可能是由于检测不确定性,杂波,作出动作,不确定性相关检测噪音。
在线战场上学习的主要挑战是如何学习环境因素的数量和位置,同时作出估计的状态。在本文中,我们分区战场状态分为两种:环境因素和为作出动作。我们可以分析整合只要我们知道 。这意味着即使我们只有样本集 ,我们也可以代表成功。因此,每个粒子代表一个值 。这种方法的优点是,我们可以降低状态空间的维数,采样和减少错误学到的战场。
这里,高斯混合博士滤波器应用于传播取决于每个博士作出状态。环境因素在战场上的位置的特点是高斯组件的混合物,在战场上和线索的数量特征是所有高斯组件的质量。摘要博士学位特点是以下吗粒子: 在哪里 是th假设作出状态集,表示重量,是相关的博士学位。后验分布后的加权粒子集来近似:
在这篇文章中,之前是博士的战场州吗相关的粒子作出轨迹。可以用以下高斯混合: 由高斯组件。为th高斯组件,预计重量,的意思是,协方差。新的环境线索的博士的采样状态在时间是由 。 也是一个高斯混合,可以表示如下: 在哪里是高斯组件的数量的新博士在时间吗 ,和 , ,和是对应的高斯参数。预测博士也因此高斯混合,可以表示如下:
在这里,是由 高斯组件之前,代表联盟的博士学位和新环境线索的博士。自检测功能也可以表示为一个高斯混合,后博士学位可以用一个高斯混合如下:
的组件方程(18)给出如下:
在这里, 。条款 , ,和可以通过标准卡尔曼滤波器;在这里,我们采用无味卡尔曼滤波(36]。
我们假设杂波的数量符合泊松分布,元素符合均匀分布在战场状态空间。然后,杂乱博士可以表示为 ;在这里,表示杂波的平均数量符合均匀分布。为了减少计算量,我们使用修剪和合并的方法来减少的高斯组件更新的数量分布(37]。
后作出状态取样的与
权重应该规范化 。与重采样步骤(24),我们可以得到粒子重新取样 。通过选择作出过渡密度建议密度,我们得到的重量如下:
通过假设只有一个环境线索在战场上,然后,我们可以得到的 与
在这里, 和 。
5.2。实现
根据上面给出的学习过程,给出该算法的具体实现方法。我们用c++来编写实验程序算法。c++库依赖关系等特征(3.0.0版本),提高(1.5.3)更正版本,和gt也使用。为了详细的实现算法,提出的算法的流程图如图5。算法的具体步骤描述1。
该算法的计算复杂度 和是线性的地标(FoV)的数量,以及检测和粒子数的数量作出状态。
|
6。实验
在本节中,一组实验进行定量验证有效性和分析该算法的性能。我们使用的虚拟机运行我们的实验4 G RAM和6 3.40 GHz Intel cpu和Unbuntu 14.04操作系统上运行。使用的实验数据来支持本研究的结果包括在本文中。在这个实验中使用的参数给出了部分6.1,在这个实验中使用的模型给出了部分4。
6.1。实验装置
如图6在一个模拟的二维空间,作出巡逻。已知地面真理(包括作出状态和地标的位置)是生成的仿真模型。黑点代表真正的地标的位置,和黑色虚线代表真正的作出。杂波符合泊松分布的数量,和杂乱博士是均匀分布的。表1显示了一些重要参数的仿真模型生成地面实况。
在这个实验中使用的传感器的距离方位传感器可以检测地标的距离5米至30米在任何方向。测量标准偏差范围(std)是1 m和轴承测量性病是2度。所使用的传感器的最大视场作出是10米和360度。
6.2。结果和分析
实验结果如图所示6,红色虚线代表学习作出州,和红色的点代表了地标的位置。红色虚线和点的集合代表了战场。结果成功地证实该算法可以学习战场州在运行时通过使用传感器检测。
为了定量评估算法的性能,我们给学会了战场州的错误数据7和8。数据7(一)和7 (b)给学习的错误数量和位置的地标。错误的位置是由最优的子模式分配(OSPA)距离38]。我们可以发现,该算法的性能可以满足仿真和评估在无人作战的要求。
(一)
(b)
(一)
(b)
考虑两组 和 ,在哪里 。向量 和 值从战场状态空间。OSPA指标被定义为一个集之间的距离和 。OSPA距离 ,截止的参数 ,被定义为 如下: 在哪里代表排列的长度与元素取自 。
学作出状态的错误数据所示8(一个)和8 (b)。我们可以发现,该算法可以生成的学习作出州可接受的精度。但错误增加随着时间的推进。这是由于作出的累积误差。
为了分析检测参数如何影响该算法作出的平均错误状态和地标生成不同概率的检测从0.1到0.99,杂波强度从0.0001到1。10每一对参数,模拟运行。这里,cardinalized最优线性分配(可乐)是用来评估的错误学习地标。从数据9(一个)和9 (b),我们可以发现,随着学习作出的错误状态减少。学会了地标的错误只略有增加PD减少。的增加会增加学习的错误位置的地标,但对学习作出错误的影响很小。
(一)
(b)
为了应用该算法在实际无人作战应用,时间成本应充分评估。如图10,我们为每一对记录10模拟运行检测概率和杂波强度,每个模拟运行,包括1000时间步。该算法的平均时间成本和CPU数据所示10 ()和10 (b)。我们可以发现探测概率的增加会增加时间成本,以及杂波强度的降低也会增加时间成本。每个时间步的平均时间成本约为500毫秒,而且它可以满足许多无人作战应用程序很好。
(一)
(b)
7所示。结论
数字双技术支持真正的战场之间的实时动态交互和仿真系统。战场我们的主要贡献是提出了一个新的在线学习算法基于RFS启用应用程序的数字双无人作战。数字双在无人作战有广阔的应用前景和极大地促进创新的无人作战模式。自数字双无人作战的实现依赖于战场上的理解,一个有效的战场学习算法是相当重要的。通过采用战场的RFS-based表示,该算法能够克服传统的基于矢量表示的局限性。验证该算法的性能通过两组实验。本文是首次尝试应用数字双无人作战区域实现数字和有实际意义的双胞胎在很多其他领域。
缩写
| 方法: | 计算机生成的力 |
| 辅酶a: | 课程的行动 |
| 可乐: | Cardinalized最优线性赋值 |
| 卡尔曼滤波器: | 扩展卡尔曼滤波器 |
| 视场: | 的视野 |
| 物联网: | 物联网 |
| OSPA: | 最优的子模式的任务 |
| 博士: | 概率假设密度 |
| RFS: | 随机有限集 |
| 作出: | 无人地面车辆。 |
数据可用性
使用的实验数据来支持本研究的结果包括在本文中。
的利益冲突
作者宣称没有利益冲突。
作者的贡献
彭王构思,设计,执行模拟和写的手稿。建成朱镕基和勇彭提供了基本思路和实验结果分析。杨美进行了实验。通用电气和李勇彭回顾了手稿。
确认
作者要感谢的支持年轻精英科学家中国科学技术协会的赞助计划。