文摘

针对预测效果差、精度低的问题和低效率在目前跨境电子商务物流成本预测方法,云computing-based智能提出了跨境电子商务物流成本预测的方法。分析云计算的概念、特点和服务模型,研究云计算相关技术,基于BP神经网络的训练BP神经网络算法的原则。获得的BP神经网络结构确定输入层的神经元数、隐层神经元的数量,输出层神经元的数量,和神经网络的激活功能。正常化的输入样本数据输入层,并选择初始重量,阈值和BP神经网络的学习速率参数来确定动力系数。本文运用神经网络模型结合火花云计算平台实现智能预测的跨国电子商务物流成本。该方法具有良好的预测能力。经过大量的训练数据的输入和输出关系,获得最合适的预测模型。实验结果表明,跨境电子商务物流成本方法的预测效果很好,它可以有效改善跨境电子商务物流成本预测的准确性和效率。

1。介绍

作为一种新形式的对外贸易、跨境电子商务环境中显示出强大的生命力相对较弱的进口和出口市场1]。跨境电子商务的过程中起着非常重要的作用的经济增长模式,以新型工业化道路,实现资源的优化配置,提高国际竞争力。跨境电子商务的发展可以通过信息化推动工业化,改变经济增长方式,走新型工业化道路。此外,加快跨境电子商务的发展有利于抓住经济全球化带来的发展机遇,应对经济全球化带来的挑战,提高国际声誉。在激烈的环境跨境电子商务产业的发展势头,跨境物流,作为一个必不可少的重要环节的操作跨境电子商务,吸引了太多的关注(2]。跨境物流运输的必要条件和基本保证跨境电子商务企业的发展(3]。因此,它是非常重要的有效控制跨境电子商务企业物流的运输成本。跨境电子商务物流成本的预测有助于更有效地整合物流资源和制定物流发展规划。

目前,相关领域的学者研究了成本预测,取得了一些理论成果。文献[4)提出了成本效益的结果和预测道路拓宽的区别。公路投资涉及的成本效益分析模型,以节省旅行时间为主要的成本效益。道路交通流量的成本效益结果扩大使用变量预测模型基于土星软件的需求。预测交通速度快是一个经济模型的输入用于比较投资收益和成本,以及由此产生的收益成本比证明了投资的合理性。该方法具有一定的有效性。文献[5)提出了一个研究海上石油服务行业的物流成本优化基于海上石油服务成本模型。海上石油服务行业的物流成本是指各种离岸操作和资源消耗的货币表现的空间运动或时间占领近海工程设备。是人类的总和,材料,和财政资源消耗在各种活动的海洋工程设备的物理运动。基于海上石油服务行业的特点,本文优化海上石油服务行业的物流成本核算法的三个方面,系统的角度来看,和宏观层面。创新和基础研究了形成机理、预测、中海油服务的物流成本和优化策略。该方法具有一定的可行性。然而,上面的方法还有预测效果差的问题,精度和效率。

解决上述问题,跨境电子商务的智能预测方法提出了基于云计算的物流成本。利用BP神经网络算法,确定BP神经网络的结构,规范化的数据样本,选择BP神经网络的学习参数,确定动力系数,并完成训练BP神经网络。使用云计算技术、云计算平台火花和BP神经网络的智能预测算法结合实现跨境电子商务物流成本。跨境电子商务物流成本智能预测这种方法效果好,可以有效地提高精度和效率的跨国电子商务物流成本智能预测。

本文的研究创新如下:(1)一个聪明的跨境电子商务物流成本预测方法提出了基于云计算(2)分析云计算的概念、特点和服务模型,研究云计算相关技术,提出基于BP神经网络的训练BP神经网络算法的原则(3)本文使用神经网络模型结合火花云计算平台实现智能预测的跨国电子商务物流成本

2。云计算技术

2.1。云计算的概念和特点

云计算是一种基于互联网的计算方法。通过这种方式,共享的软硬件资源和信息可以按需提供给计算机和其他设备(6]。云计算是一种计算模式,集大规模计算、存储、应用程序,和其他分散的计算资源协同工作,为用户提供基础设施、平台、软件、应用程序和其他服务通过互联网。云计算的特点总结如下:(1)超大规模:云计算服务提供商有大规模的服务器组。谷歌有100万多个云计算服务器和每个云计算服务提供商如亚马逊、IBM和微软至少有几十万。服务器“云”可以给用户先进的计算能力(2)云计算平台的虚拟化:最大的特点在当前的发展阶段是依靠一系列的虚拟化等技术实现虚拟控制、管理、调度和应用程序的硬件资源。用户可以使用网络资源提供的云服务提供商通过虚拟平台,但他们可以完成复杂的计算,由当地计算机无法解决(3)可扩展:在云计算系统,随时可以扩展的服务器数量,和更多的计算资源可以提高云计算的处理能力(4)按需服务:在云计算应用程序,用户可以根据自己的需要购买云服务(5)高可靠性:应用程序运行在服务器端,由服务器端计算处理,生成的数据也存储在服务器端。当服务器有问题,其他服务器的任务将继续运行,保证应用程序的正常进展和计算,用户不需要备份,数据自动恢复和保存在服务器上(6)低成本:“云”的运作使企业减少数据中心的运营成本高,和云服务提供商负责根据用户的需求

2.2。云计算服务模型

云计算有三个服务模型,软件即服务(SaaS)、平台即服务(PaaS)和基础设施即服务(IaaS)。云计算服务模型如图1

2.2.1。软件即服务(SaaS)

SaaS提供完整的程序作为服务。SaaS服务提供商统一部署应用服务软件在服务器上和分裂和价格根据规范应用服务软件。用户可以通过互联网支付服务费用享受应用软件服务。的数量和使用时间可以根据用户的需求定制应用软件。

2.2.2。平台即服务(PaaS)

PaaS是一个基本的平台服务用于生成各种应用程序。PaaS服务提供者可以为用户提供基本的平台服务。用户可以购买从PaaS平台服务提供者根据自己的研发需要定制研发平台。

2.2.3。基础设施即服务(IaaS)

IaaS基础架构服务,它提供了一个场所为出版、跑步、和处理虚拟机和存储空间。IaaS服务提供者提供服务给用户基于虚拟资源的粒度。IaaS提供实时计算资源的可伸缩性的可能性和按需存储设备。

2.3。云计算相关技术
2.3.1。Hadoop云计算平台

Hadoop是一个分布式系统基本框架由Apache软件基金会开发,它允许用户忽略底层细节在开发项目和重点发展的编程模型(7]。Hadoop包括三个主要组件:分布式文件系统(Hadoop分布式文件系统,HDFS), HBase MapReduce编程框架和分布式数据库。

(1)HDFS。HDFS文件系统设计灵感来自谷歌的GFS (Google文件系统,GFS)和高度容错。HDFS是一个可靠和容错文件系统适用于低成本的大规模数据的存储。HDFS的组织结构如图2

在HDFS文件写一次读多次,和系统不需要部署在昂贵的和稳定的硬件设备。HDFS采用主/从体系结构,可以实现应用程序优化大量数据的吞吐量。HDFS集群包括NameNode节点和若干个DataNode节点。这两种类型的节点有不同的职责,但他们相互合作来完成不同的任务通过工作在不同的模式。

(2)MapReduce编程框架。MapReduce是并行操作的谷歌提出的编程模型在大规模数据集8]。MapReduce工作包含大量的Map和Reduce操作对。地图操作通常执行数据操作类似于过滤、排序和数据转换。减少操作通常都是用来完成数据聚合操作。MapReduce工作流如图3

根据任务的特点,数据处理过程一般分为两个阶段:Map和Reduce:在映射阶段,地图任务读取输入文件块,分析了并行数据,并保存地图任务节点的处理中间结果。在降低阶段,减少任务读取和合并中间多个地图任务的执行结果。地图任务,减少任务可以并行执行,从而加快整体处理速度增加计算节点的数量。跨境电子商务所需的参数智能成本预测包括电子商务成本,电子商务价格,数量和电子商务。

(3)HBase分布式数据库。HBase分布式数据库是一个开源实现谷歌的大桌子,大桌子的模仿和提供所有功能数据库基于Google文件系统。HBase数据模型是一个排序、多维稀疏,长期存储在硬盘上的映射表。HBase是主要用于存储非结构化和半结构式松散数据。

2.3.2。火花云计算平台

火花是一个通用并行计算框架由加州大学伯克利分校的AMP实验室基于MapReduce计算框架(9]。基于MapReduce的优点,它直接在内存中保存中间结果的任务。火花的运行架构图所示4

任务控制节点(驱动程序)发送分区任务设置集群运行的工作任务节点(工人节点)通过集群资源管理服务(集群管理器),在每个节点上执行相应的程序(执行器)。

抽样是火花的核心和整个火花的基础架构。所有操作的火花是抽样的基础上实现的。抽样是一个数据收集,具有良好的容错机制,可以并行执行。抽样可以从现有的数据集在内存中创建通过并行处理功能,或从一个文件通过文本文件函数。同时,抽样提供转换和操作操作抽样数据集。转换可以从现有的随机数字拨号改为新的抽样转换功能,如地图,过滤和加入。操作是将抽样的数据集上运行结果回到司机或写存储系统,如减少、计数、saveAsTextFile等功能操作。

3所示。BP神经网络

3.1。BP神经网络的原则

BP神经网络的误差反向传播神经网络的缩写。它由一个输入层、一个或多个隐藏层和输出层,每一层都是由一定数量的神经元(10]。这些神经元是相互关联的,相邻层的神经元相互连接,但是没有每一层的神经元之间的联系。这样连接构成一个分层神经网络系统。BP神经网络的拓扑结构如图5

当BP神经网络获得一个输入信号时,信号传输和计算从输入层神经元隐层神经元,然后传播从神经元隐层到输出层神经元,最后,预测结果是输出层神经元的输出。这是一个过程,状态更新一层一层地,向前传播网络的过程。如果有输出之间的误差预算结果和实际的期望值,网络系统的话,将会获得错误从输出层的输入层一层一层地,在传输过程中,修改每一层的连接权值,重新分配网络权重,并减少错误,直到获得满意的结果。这个过程称为网络反向传播过程。重复上述过程,直到误差满足训练误差要求,或培训达到的最大数量的步骤,并完成学习。一旦学会了BP神经网络,预测系统只进行向前传播,没有误差反向传播。总之,BP神经网络的学习过程是不断调整的过程连接每一层的重量。

3.2。BP神经网络算法的数学描述

BP神经网络算法是一种人工神经网络适用于多层神经网络在导师培训。它的收敛法是通过最陡梯度下降法进行。下面是一个人工神经网络的数学描述:

假设一个人工网络共有 层和 每一层的节点,节点除了输入节点只能获取信息从上一层的神经网络。同样的,每一层的节点只在输出节点传输信息的下一层节点,每个节点的激活函数的神经网络将乙状结肠类型(11]。为了使整个过程更容易理解,假设整个神经网络的输出层只有一个节点 现在假设 训练数据, 节点的输出吗 , 节点的输出吗 对应于 样本。当输入的 单位的 层是 样本,计算公式的输入节点 在哪里 代表了 层,当 样本的输入,输出的 单元节点。误差函数的计算方法 在哪里 实际产出的单位吗 总误差的计算公式

定义:

然后:

然后,有

BP神经网络算法的具体步骤如下:(1)神经网络的权值初始化(2)重复迭代的误差符合下列要求: 在哪里 代表了预设精度。

过程:

积极的方向: , , 根据计算每一层的计算

相反:计算 2 l2的每个单元

更新重量: (3)算法结束

在培训过程中,样品在需要的时候给出随机。此外,神经网络的动力,学习效率需要更改根据迭代的数量。

4.1。跨境电子商务的概念和特征

跨境电子商务指的是利用现有的工业平台和资源优势,探索特定的跨境电子商务综合服务系统和基础信息标准和接口规范,如网上报关、检验检疫、退税、外汇结算参与跨境电子商务导入和导出。实现标准化信息流之间的海关、国家检验、国家税收、外国管理和其他部门和电子商务企业和物流支持企业(12]。跨境电子商务是一个全球性的、无纸化和直接的国际贸易活动。交易主体在不同关税区之间的电子商务平台达成交易协议,付款和结算通过各种国内外金融支付机构,然后通过跨境物流发送商品给消费者完成交易。

跨境电子商务是一种新的贸易和跨境物流模式依赖互联网。与传统出口电子商务相比,它可以满足客户需要更快更方便,具有以下特点:(1)开放性和全球性:跨境电子商务与传统的不同形式的对外贸易。电子商务企业的信息可以显示在网页上,从而增加更多的贸易机会,外贸企业可以节省大量人力和物力。与此同时,没有时间和地点的限制,它在世界各地蓬勃发展(2)多边化:多边化体现在,当电子商务企业和客户达成交易协议,他们可能使用国家达成交易的交易平台和使用B国付款的支付平台,和国家的物流机构C进行物流交付根据订单的要求。跨境电子商务多边化的特点非常明显(3)直率:跨境电子商务企业可以显示商品的具体信息通过网络服务平台,并随时更新。客户可以直接查询他们需要的产品在网络服务平台,通过服务平台进行商品交易,并完成购买和销售合同的签署。它是直接和不同于传统的对外贸易(4)低成本:电子商务活动进行的跨境电子商务企业自己完成网页或网络服务平台,网上商品所有权的交付完成,大大降低了时间成本和劳动成本,提高了工作效率

4.2。物流成本的概念和分类

物流成本是指物化劳动和生活劳动消耗的货币表现在企业的物流活动13]。它包括求和的人力,材料,和金融资源消耗在运输的过程中,存储、包装、装卸、流通加工、物流信息、物流管理,以及营运资金占用成本、库存成本、风险和存货保险成本与库存有关。其中,物流运输成本是物流成本的一部分。物流运输成本主要包括劳动力成本,如运输人员工资和福利;营业费用,如燃料车辆的运行成本、折旧、和公路运输管理费;和其他费用,如差旅费。

物流运输成本可以分为几类:(1)根据不同的运输模式,物流运输成本可以分为公路运输成本,铁路运输成本,水路运输成本,航空运输成本和管道运输成本(2)根据成本特点、物流运输成本可以分为固定运输成本和运输成本的变量。固定运输成本是指成本的变化不会改变运输体积和运输里程。变量运输成本的变化与运输体积和运输里程的变化(3)根据不同的货物交货批次、物流运输成本可以分为车辆运输成本和拼箱运输成本。车辆运输成本是指运费计算和收取的运费率。拼箱运输成本是指运费收取的运费率拼箱运输偶尔交付货物时,货物不到完整的车辆和整个批吨位,和货物是根据实际的重量计算(4)根据隐藏成本、物流运输成本可以分为显式的运输成本和隐含的运输成本。明确的运输成本是指实际的支出,可以看到在运输过程中,包括各种物化劳动的货币表现和生活劳动消耗在运输过程中。隐式运输成本是相对于显式的运输成本。它是隐藏的,很难避免,难以量化。它主要包括成本的增加空车辆没有货物,成本的增加对流运输、迂回运输成本的增加,成本的增加重复运输、远距离运输成本的增加,成本的增加选择不当的运输能力

5。跨境电子商务物流成本Spark-Based BP神经网络智能预测方法

本研究面向跨境电子商务的物流成本,通过BP神经网络,结合云计算平台,预测跨境电子商务的物流成本。

5.1。确定网络结构

使用BP神经网络进行预测的重要前提是确定一个合理的网络结构。网络结构合理与否直接影响预测结果的准确性(14]。当构建BP神经网络结构,减少系统规模的原则,减少系统的复杂性,应遵循和缩短学习时间。通过确定输入层神经元的数目,隐层神经元的数量,输出层神经元的数量,和神经网络的激活函数,得到一个合理的神经网络结构。

5.1.1。确定输入层神经元的个数

输入BP神经网络中的神经元的数量决定根据要解决的问题和数据表达的方式,是指数量的因素影响输出结果。输出层神经元数量的BP神经网络的跨国电子商务物流成本是许多因素影响跨境电子商务物流成本。

5.1.2中。确定隐层神经元的数目

BP神经网络的隐层神经元在提取和存储中发挥作用的内部法律样本。系统将几个重量参数赋给每个隐层神经元,增强神经网络的映射函数。此外,隐层神经元的数量直接影响网络的非线性性能,也决定了要解决的问题的复杂性。的基本步骤来确定隐层节点的数量如下:

通过确定隐层节点数的值范围,确定隐层节点的数量经过多次培训流程,原始样本数据输入,网络研究,误差比较,调整节点的数目不断减少错误并确定最佳数量。一般情况下,三层转发网络隐层神经元的数目 在哪里 代表样品的数量, 代表了隐层神经元的数量,和 表示输入层的神经元数。如果 , ;选择公式的隐层神经元的数目 ,主要有两种形式,即 在哪里 表示输入层的神经元数 代表一个常数从1到10。

5.1.3。测定输出层神经元的数目

类似于神经元的输入层、输出神经元预测的目的,和神经元的数量是由预测结果的类型。跨境电子商务物流成本预测的结果是货运成本,因此在输出层神经元的个数是1。

5.1.4。神经元激活函数的决心

在BP神经网络的建设,为了方便学习的输入信号和输入信号汇聚,tansig函数的切线s形的函数的形式被选中作为隐层神经元的激活函数。为了使整个网络的输出可以取任何值,线性函数Purelin作为输出层神经元的传递函数。

5.2。学习样本预处理

样品的数量在BP神经网络的输入层决定了网络的特征值。更多的样本输入的输入层,BP神经网络的多特征值需要识别。为了避免指标用更少的损失值或系统过早陷入饱和区由于这些差异,数据样本输入的输入层需要规范化。考虑跨境电子商务物流成本驱动的特点及其对结果影响的跨国电子商务物流成本预测,计算最常用的数据样本预处理方法 在哪里 代表数据的归一化的结果 , 代表数据的实际价值 , 代表集团的最大和最小值的数据,分别。

5.3。学习参数的选择

BP神经网络的学习参数包括初始权重、阈值和学习速率。下面具体介绍了学习参数的选择方法。

5.3.1。确定初始重量和阈值

BP神经网络的初始权重和阈值直接影响神经网络的学习结果。初始重量和阈值的大小与输出值的融合,在学习过程中,是否能达到局部最小值和计算机网络的收敛速度。初始位置的选择的基本要求是,在初始重量输入是积累,它可以确保每个微不足道的元素的输出值接近于零。基于上述原则,初始重量和阈值之间通常是随机选择的

5.3.2。学习速率的测定

网络学习速率决定了变化产生的重量和阈值在每个周期(15];重量和阈值之间的关系,学习速率 在哪里 代表连接权重的变化, 代表了阈值的变化, 代表了网络纠错, 代表网络输入值, 代表了学习速率。

5.4。动量系数的确定

动量词反映了影响最后的重量变化对动量动量系数。动量系数的值范围 动力常数等于0时,根据获得的重量变化梯度。当动力常数1,新的重量变化等于最后体重改变。引入动量,迭代后连接权重和阈值的关系 在哪里 代表了动量项和 代表了动量因子。

5.5。分布式BP神经网络并行计算

开展跨境电子商务物流成本预测时,需要培养大量的数据使培训结果满足要求。因此,本文结合了火花和BP神经网络,并使用云计算平台的优势预测跨境电子商务的物流成本。

需要训练的BP神经网络算法在多个节点。的最终预测值的计算方法 在哪里 代表的预测价值 节点和 代表的重量 节点。每个节点的标准误差表示为 在哪里 表示目标的每个输入BP神经网络的训练集。跨境电子商务物流成本预测算法的实现步骤下火花平台如下:(1)跨境电子商务物流成本获得大量的数据预测的分布式文件系统火花的平台。地图的配分函数将预测数据集划分为火花 部分, 火花节点的数量吗(2)获得的预测结果是通过运行设计BP神经网络算法在每个节点的映射函数,相当于 神经网络(3)最后,通过减少功能的预测价值 节点承受体重决定得到最终预测值

通过上述步骤,跨境电子商务物流成本的智能预测是实现。

6。实验分析

6.1。实验环境和数据

为了验证的有效性云computing-based智能跨境电子商务物流成本预测方法,实验建立了一个火花平台9节点组成,每个节点的机器配置英特尔(R) (TM)核心i7 - 3537 u CPU@ 2.50 GHz, 8 GB的内存,160 G的硬盘空间,100 Mbit / s网络带宽。火花版本1.0.2中。本文使用ubuntu12.04系统JDK1.7.0_55版本用于实验,SSH安装以确保节点之间的通信。在这个实验中,通过一个独立的pseudodistribution系统调试,一个完全分布式环境中由9节点性能测试期间使用。跨境电子商务物流企业为例,跨境电子商务物流成本样品预处理,利用聚类分析方法,定性和定量相结合的方法,综合考虑跨境电子商务物流成本驱动的特点及其对预测结果影响的跨国电子商务物流成本。的输入样本预测模型分为两个部分:训练样本和预测样本。训练样本是用来确定最优BP神经网络模型的权值和阈值,然后,优化参数代替BP神经网络,和预测样本输入得到预测结果。

6.2。跨境电子商务物流成本预测和评价指标

本文的预测效果,预测精度和预测效率作为评价指标。成本预测与实际预测成本来衡量预测的效果。越一致预测成本与实际成本预测,预测效果越好。均方根(RMSE)预测的预测精度是用来测量精度。RMSE值越小,预测精度越高。RMSE是主要性能指标测量的优缺点跨境电子商务物流成本预测算法。计算公式是 在哪里 样品的数量, 的实际成本 , 预计成本在时间吗 使用时间预测成本来衡量预测效率。预测的时间越短,预测效率越高。

6.3。比较跨境电子商务物流成本预测的影响

为了验证该方法的预测效果,文献[的方法4]和文献[的方法5)与该方法用于比较,比较结果的跨境电子商务物流成本预测的结果不同的方法如图6

从图可以看出6跨境电子商务物流成本预测的结果基于文献[的方法4]和文献[的方法5)是完全不同于实际的跨国电子商务物流成本预测的结果。跨境电子商务物流成本预测方法的结果更符合实际的跨国电子商务物流成本预测的结果。可以看出,相比之下的方法文献[4]和文献[的方法5),该方法有更好的预测效果跨境电子商务物流的成本。

6.4。比较跨境电子商务物流成本预测的效率

为了进一步验证该方法的预测效率,文献[的方法4)的方法,文献[5),该方法用于比较,跨境电子商务物流成本预测的比较结果不同的方法如图7

从图可以看出7与预测样本的数量的增加,跨国电子商务物流成本的预测时间不同的方法增加。当预测样本的数量是800,跨境电子商务物流成本预测的时间参考的方法(4)是44.5秒,跨境电子商务物流成本预测的时间参考的方法(5是55岁,而跨境电子商务物流成本预测该方法的时间只有22.5秒。可以看出,相比之下的方法文献[4]和文献[的方法5),跨境电子商务物流成本预测该方法的时间比较短,它可以有效改善跨境电子商务物流成本预测的效率。数据67比较本文方法与传统方法。通过仿真可以看出,本文方法具有良好的预测能力,更高的精度,更好的容错。

6.5。比较跨境电子商务物流成本预测的准确性

在此基础上,该方法的预测精度进一步验证。的方法,文献[4)的方法,文献[5),该方法比较,分别和跨境电子商务物流成本的RMSE值预测的不同的方法。比较结果如表所示1

根据表中的数据1,预测样本的数量的增加,跨国电子商务物流成本预测的RMSE值不同的方法增加。当预测样本的数量是800,跨境电子商务物流成本的RMSE值预测的方法,文献[4)是21.47%,跨境电子商务物流成本的RMSE值预测的方法,文献[5)是23.32%,而跨境电子商务物流成本的RMSE值预测该方法仅为13.65%。因此,与文献[的方法相比4]和文献[的方法5),跨境电子商务物流成本的RMSE值预测的方法更小和跨境电子商务物流成本的预测精度较高。

7所示。结论

跨境电子商务的智能预测方法基于云计算的物流成本提出了提出了充分发挥云计算技术的优势。BP神经网络算法用于训练大量的物流参数的输入和输出关系。跨境电子商务物流成本的智能预测有很好的效果,可有效提高精度和效率的跨境电子商务物流成本智能预测。然而,在智能跨境电子商务物流成本预测的过程中,由于BP神经网络需要规范化的样品在输入样本之前,有一个问题,选择小数点后和有一些错误。因此,在接下来的研究中,需要进一步考虑的选择小数点后提高BP神经网络的计算精度,从而提高预测结果的准确性。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

本研究支持的科技教育和科学研究项目为中青年教师在福建省(批准号JAT191924)。