文摘
现代智能网络提供很多方便社会的发展,尤其是对一些实用的np难优化问题。在本文中,我们研究一个游戏情况下这是一个沙漠穿越的最优策略问题基于智能网络,然后提出一个最优路线选择决策。我们构建一些动态多目标网络问题,并使用启发式算法来解决这两个问题在四层。本文的创新在于最优路线选择策略,考虑不同的环境条件和自己的情况。实际工程问题和数学之间的交叉研究本文中灵活应用。此外,本文给出的策略是一个大方向而不是一个特定的结果,这也是符合游戏的多样性的特点优化结果。
1。介绍
智能网络是一个很好的选择来解决一些具体问题。基于智能网络的优化算法具有良好的性能在解决最优路线选择决策问题。在实际的路由问题,我们经常抽象的网络优化问题。因此,我们需要找到最优路径从源节点到目标节点网络。它已经被广泛应用于许多领域,如旅行商问题(TSP), 5 g网络中分布式资源分配优化(1,交通工程5 g网络(2]。
在过去的几十年里,许多研究人员致力于智能网络应用于解决一些实际的赋权优化问题(3和许多有趣的结果4- - - - - -9]。现有的最优路线选择决策问题可以分为基于智能网络三个方面。第一节课是基于遗传算法(4,10,11]。第二个是基于蚁群优化算法(5,6,12]。最后一个方面是基于神经网络(7- - - - - -9]。许多优秀的结果(13- - - - - -17)取得了上述智能算法及其改进算法,已经广泛应用于最优路线选择的方面15- - - - - -17在目前的阶段)。同时,它是一个最好的解决方案将特殊的实际问题转化为一般的图论问题。
此外,智能网络算法指的是一些相对新颖的算法在工程实践和理论。所有这些算法和技术使应用程序快速和安全。然而,有必要学习现有的成熟算法来弥补自己的弱点,因为实际要求5 g网络迅速发展变化。
全球移动数据流量智能网络预计将增加在现代社会指数增长。智能网络可以很容易地把作为现代最优问题是一个np难问题,因为现代最优问题始终是一个非线性多目标和多约束优化问题。有一些成熟的智能算法来解决它,如遗传算法和蚁群优化算法。然而,这些算法的收敛性是有限的网络规模。因此,这是一个有趣的和具有挑战性的问题。
在本文中,一个案例研究是出于沙漠穿越的游戏。在本例中,我们使用智能网络数据流量解决沙漠穿越问题,探索最优路线检测决策。我们也给不同的策略在不同层次不同的问题。
总结了我们的研究的主要贡献如下:(1)与现有的工作相比,我们使用智能网络数据流量首次玩游戏。这是一个交叉的组合数学和工程问题。(2)给出了不同的优化策略对不同问题相应的水平。快速和最优路线选择决策是由本文。本文的其余部分安排如下。节2,我们提出本文的相关工作和当前最先进的。节3,介绍了案例研究的问题描述。节4,提出问题是数学建模和解决。部分5仿真验证和分析的结果。最后,部分6总结本文并给出讨论的优点和缺点的改进。
2。相关工作
根据智能网络优化问题,现有优化算法可以分为概率算法(4- - - - - -6,10- - - - - -12)和逻辑算法(7- - - - - -9,18,19在目前的阶段。所有这些算法有很大的要求的提高算法效率。
智能网络应用于各种预测。刘等人。20.)提出了一个预测柴油机的燃油消耗和排放车辆在智能网络环境。Galeshchuk [21)使用时间序列和神经网络预测研究汇率。Gnana专家Sheela和发展22)提出了一种基于混合神经网络算法计算模型来预测风速值得称赞。Nikolov et al。23)提出了一个被动的数据率估计方法利用商业调制解调器的常用参数在智能交通系统中的应用。太阳et al。24)提出了持续的交通预测通过vehicle-to-infrastructure cyber-physical道路系统的通信。
网络优化基于智能网络也应用于很多方面。特别是,学者们结合智能网络和目标优化方法建立模型。弗莱彻等人。25)用多目标优化解决nonspecialized系综分类器问题。王等人。26)提出了一种有效的排序可持续供应网络优化和多目标优化框架的决策。田et al。27)提出了交通工程在部分段路由部署IPv6网络与强化学习。李等人。28)提出了一种自组织的互惠模块化神经网络。
在路由策略选择方面,也有很多的研究(29日- - - - - -40]。其中,有许多研究TSP (34- - - - - -37]。彭et al。38大规模的支持向量机训练)提出了一个选择。周et al。39)提出了一个选择卸载手机通过移动网络流量。夏h . et al。40)提出了一个高效semantic-aware大规模物联网的服务发现机制。
近年来,越来越多的研究人员利用智能网络算法来解决一些实际问题。Meo (41)提出了一种方法来预测的强度关系信任和不信任在线社交网络(OSNs)。Kasim [42)提出了一个高效、健壮的深度学习基于分布式拒绝服务攻击。Hareedy et al。43)最小化有害物体多维基于代码的数量。
与此同时,越来越多的研究人员已经创造了新的算法来解决最优决策问题。Lei et al。44]使用QUALIFLEX方法,它是一个相对新颖的多属性群决策(MAGDM)技术,以获得最优的选择。Lei et al。45)也提供了概率语言重量(PL-MAGDM)和不完整的信息。魏et al。46)已经开发出单值下的椰子核模型来解决MAGDM neutrosophic二元数组语言集(SVN2TLSs)。董et al。47)提供了一个余弦相似性与HFLTSs QUALIFLEX方法指标。湾和东48]提供了一个全面、系统的介绍为区间值直觉模糊集排序方法,与区间值直觉模糊集的多准则决策方法,群体决策方法和区间值直觉模糊偏好关系。
3所示。问题描述的案例研究
在本节中,我们将给出一个案例来研究最优策略的基于智能网络穿越沙漠。,问题是制定一个数学问题,结合实际的路线选择决策和无向图与网络。水平意味着一些约束问题意味着目标函数。细节描述如下。
3.1。符号的定义
3.2。一个案例
为了更好的描述问题,我们介绍以下沙漠穿越的游戏。有一个球员在沙漠和沙漠地图。玩家可以使用给定的初始资金购买一定量的水,食物,和其他日常用品最佳穿越沙漠。可以补充资金或资源在一些矿山和村庄,和天气将在他的穿越方式不同。玩家需要使用现有的资源,从源点到某个目的地点走穿过沙漠。因此,最优问题是球员在指定的时间内到达目的地,剩下的钱,尽可能多。
我们做出以下假设游戏的问题:(我)初始条件的球员在0天的起点。玩家必须在截止日期之前到达目的地,然后,沙漠穿越游戏就结束了。(2)穿越沙漠需要水和食物,他们都是测量与盒子。水和食物的总重量不应超过每天的最大重量。如果水或食物耗尽在到达目的地之前,游戏失败。(3)每天的天气有三个条件:“阳光”,“热”和“沙尘暴。“天气是相同的所有地区的沙漠。(iv)玩家可以从一个点到另一个相邻的地方或保持呆在目前的点。当天气是“沙尘暴”,玩家必须保持目前的观点。(v)当一个球员是一天,住在一个点的资源称为基本消费,消费比基本消费走路时的两倍。(vi)玩家可以买水和食物的基本价格的起点在0天与他们的初始资金。玩家可以返回剩余的水和食物在一半的基本价格每箱当他到达了目的地。(七)当玩家停留在我的,他可以通过挖掘获取一些基金,基金的数量得到矿业在一天之内被称为基本收入。如果玩家选择,资源消耗的数量比基本消费两次;如果不是,消耗资源的基本消费的数量。不允许开采当天当玩家到达。矿业是允许同时在“沙尘暴”的日子。(八)当通过或住在村子里,玩家可以买水和食物。然而,比基本价格每箱价格的两倍。
3.2.1之上。的描述水平
1级(1)参数设置:见下表3。(2)天气情况:见表4。(3)地图:见图1。2级(1)参数设置:1是一样的水平(2)天气条件:1级是一样的(3)地图:见图23级(1)参数设置:见下表5。(2)天气条件:没有“沙尘暴”10天。(3)地图:见图3。4级(1)参数设置:3级,这几乎是一样的,但差异如表所示6。(2)天气条件:“沙尘暴”更少30天。(3)地图:见图4。
3.2.2。问题
基于上述假设,考虑以下两个问题来解决。
问题1。有一个球员和所有天气条件在整个比赛期间提前知道。问题是给最好的穿越沙漠的策略级别1和2,分别。
问题2。有一个球员和球员只知道当前的天气,所以他可以决定当天的行动。类似的问题1,问题是给最好的策略在3级和4级,分别。
4所示。制定和数学建模问题
为了更好地描述建立模型,我们把上面的穿越沙漠问题转化为基于智能交通网络的网络优化问题。认为地方的地图连接通信网络中的节点,在特殊节点的村庄和煤矿。我们抽象这些地方互联网络节点和地图无向图。
基于上述转换、数据5- - - - - -8的新的无向网络图1 - 4是地图1 - 4,分别。图6地图的新无向网络图2所示。
在网络,“年代”、“米”,“V”和“E”的缩写是“开始”,“我的,”“村”和“,”。,网络边缘的重量代表了两个连接节点之间的网络节点数量。
4.1。状态空间分析
状态变量包含四个整数组件。我和t分别的日子和游戏的日子,数量:
j地图上的位置,米是在地图上点的数量:
W和F水和食物的箱子的数量是: 最大重量在哪里吗和d和e表示每箱重量的水和食物,分别。
最重要的是,
状态变量的大小是
当t是30,米是64,是230000000。空间复杂度是可以接受的一台电脑。
4.2。问题1
4.2.1。准备模型的建立
玩家决定的流程图如图9。
这是一个马尔可夫决策过程,四元组组成米= ( ,A, Psa,R)代表国家,一个代表的一组操作,Psa是一个转移概率,R是一个奖励函数。然后,价值函数的定义是
在 ,固定的值π和年代给出了。这个动作一个是 这是由π和年代。
在接下来的时刻,年代将被转移到年代′的概率 ,和 是
然后,我们定义行动的价值功能一个是
最优策略如下:
其目的是发现可以最大化的价值函数在任何初始条件年代。
因此,为了获得越来越多的最后剩下的基金,我们构建一个客观优化模型来解决上述最优问题的基础上,新的智能网络,然后将所有的目标和约束转换为网络流问题。优化模型代表了最优方案由线性规划,非线性规划,动态规划、整数规划和系统科学的方法。一般优化模型的数学语言描述如下: 在哪里f(x)是目标函数,x是决策变量,ω可行域。
对于这个问题,模型的建立是描述如下。
优化约束是最后期限,最大重量和生活条件。假设网络中最后剩下的基金C最后期限是D,最大重量 。因此,生活条件的限制不能是空的,以确保球员不会失败在沙漠穿越游戏。假设剩余的食物F剩下的水W。因此,建立了优化模型和定义的约束优化问题的解决方案定义如下。我们开始与网络约束: 在哪里C1代表了基本的收入,C2代表采购资源的成本,C3代表矿业收入,d代表每箱重量的水,e代表食物每箱的重量。
采购资源的成本 在哪里一个代表了玩家的成本在起始节点0天,b代表了玩家的成本通过或呆在村里时,和c表示返回的钱剩下的水和食物,当他到达目标节点。
矿业收入 在哪里f代表了矿业天代表的基本收入。
4.2.2。算法的描述
在前面的小节中,我们进行了相应的网络问题的数学建模。解决方案是如图的流程图10。在这里,我们可以使用启发式算法来解决上面的动态规划问题。我们找到最短的路线从起始节点到目标节点,其标记为第一个情况。在第一个情况下,我们不考虑任何额外的资本消耗。相反的,我们考虑一些收入等球员的穿越方式开采和马克的第二种情况。玩家需要购买尽可能多的食物和水在源节点并获得尽可能多的收入在穿越日期范围有限。
4.3。问题2
4.3.1。模型的建立
对问题2同样,我们构建目标优化模型的问题1。为了让更多的最终剩余资金,我们考虑矿业积极的收入。
根据条件期望公式,
采矿的收入在一个晴朗的日子问1和1在一个炎热的一天问2:
然后,定义积极的收入从矿业的关键值: 在哪里 。
在3级,走路消耗的数学期望问1是
,最后剩下的基金给出的最小资源消耗的网络节点开始
在四级,认为沙尘暴的概率是0.1。行走的数学期望消费问1是
3级是一样的,最后剩下的基金从开始节点给出的最小的资源消耗
4.3.2。算法的描述
基于伯努利大数定律,如果μ是这个事件的次数一个发生在n独立测试和事件的概率一个发生在每个测试 ,然后,对任何正数ε,有
5000的概率随机,晴天,根据图进行模拟11。,最终收入的平均值作为近似的值。
5。验证
来验证我们的研究中,我们采用现实的假设,在四层进行模拟实验。
5.1。1级
5.1.1。结果
根据图7、表7第一种情况是一种()的最短路线从开始节点到节点使用启发式算法结束。
根据上述算法,表8第二种情况是另一种方式()。
5.1.2中。分析的结果
第二,资源不足,玩家需要去节点V买水或食物。因此,我们认为,在这种情况下,玩家不去节点V买水或食物。图13第二个情况记录的结果一个。在第二次这样的情况,我们还发现,玩家已经两次购买资源的村庄和购买行为将不可避免地减少总钱。因此,我们假设玩家会发现这种行为发生时目的地的最短路线。而且,我们使用B和C代表球员的第一和第二村采购行为,分别。
在数据14和15,如果玩家选择B或C,游戏将会在15天内或19天,这意味着球员在比赛中失败。
总而言之,我们认为战略是最优路线选择决策。
5.2。2级
5.2.1。结果
根据上述多目标规划算法,表9展示最好的基于智能网络穿越沙漠的策略级别2。
5.2.2。分析的结果
上述结果,其他两种类型的模型讨论了次优的解决方案。在数据16和17记录级别2的结果是,B和C,分别与一级相同的定义。
根据图18,一个在2级是最好的策略。
5.3。3级
5.3.1。结果
在3级,我们情况划分为两种类型。一个是没有矿业开采和另一个。图19是一个比较。
如图193级,最好的策略是没有开采。
5.3.2。分析的结果
通过仿真实验,我们发现的情况没有比其他矿业,不管天气。因此,最好的策略级别3没有挖掘球员的穿越路线。
5.3.3。算法比较和结果的分析
在本节中,我们与我们的算法进行比较的(49在相同的数据集。
表10给结果的,分别比较两种算法的3级。我们可以看到从表10有9685.9美元在我们的算法和9400美元(49]。这是因为我们的算法不仅考虑使用马尔可夫链,还试图把条件期望,走路消耗的数学期望问1,伯努利定律大量三级。然而,该算法在49]简单地认为使用马尔可夫链在3级。因此,随机天气的可靠性增加,结果是更好的。
5.4。4级
5.4.1之前。结果
在四级,我们情况划分为四种类型。第一个是没有采矿行为(第一种情况)。第二个是只有采矿行为(第二情况)。第三个是采矿行为后购买行为(第三情况)。煤层开采后,最后一个是购买行为的行为(第四情况)。图20.显示了四种情况下的结果进行比较。
5.4.2。分析的结果
曲线在图20.分析如下。
第一的情况下,没有采矿行为意味着只是旅行在构建网络。只有几天旅行穿越和天气条件不敏感。因此,的影响最后剩下的基金的价值很小,曲线相对稳定,基本没有波动。
第二的情况下,矿业收入很高,当天气不好,和开采时间和平均收入将会增加当天气变得更好。曲线的增长趋势接近二次曲线,如图20.。
第三,玩家需要更多天购买食物和水而第二个情况。资源消耗远远大于其矿业收入和更符合成本效益。然而,当天气变得更好,穿越时间是很重要的,由于缺乏明显的资源约束。这将导致成本效应在路上花费额外的时间。我们可以看到图的曲线是低于其他策略20.。
第四,玩家需要更多天购买食物和水后矿业与第二个和第三个的情况。资源消耗远远大于其矿业收入时天气不好,少得多的成本效益。收入迅速增加,当天气变好,和剩下的球员最终最高基金当天气适合他的跨越。
因此,曲线就像“S。“因此,从仿真结果我们可以看到,第一个情况没有穿越沙漠的最佳策略 。当p还不确定,有多少价值p第二种情况对应的最优策略。
5.4.3。算法比较和结果的分析
在本节中,我们与我们的算法进行比较的(49在相同的数据集。
表12分别给出了两种算法的结果在4级。我们可以看到从表12有超过13193美元当晴朗的天气的概率 在我们的算法和13070美元(49]。节中描述的算法改进的原因5.3;此外,我们的算法考虑p是不确定的,有很多的价值观p第二种情况对应的最优策略。这表明我们不仅是全面,但也有好的结果。
6。结论和未来的工作
在本文中,我们解决最优穿越沙漠一个球员的策略。我们给一些合理的假设和实际情况,将问题转化为一个智能网络问题。本文获得的策略在指定条件下有很强的适应性。然后,我们构造动态多目标网络问题和使用启发式算法解决这两个问题在四个水平。建立的模型具有较高的可移植性和适合一些网络np难问题。此外,最优路线选择决策基于智能网络给出一个大致方向,而不是一个特定的结果。也就是说,智能网络在发现高绩效,使最优策略。
未来的工作和研究方向将致力于运用以上研究其他np难问题通过使用动态编程,遗传算法,粒子群优化根据马尔可夫链。,更解决方案可以通过增加随机获得的时代,从而使解决方案更适用的范围。
数据可用性
使用的数据来支持这个研究的发现文章中是可用的。
的利益冲突
作者宣称,他们没有利益冲突。
确认
这项工作得到了中央大学基础研究基金(批准号JB210707)。