文摘

需求预测是供应链的主要问题之一。它旨在优化库存,降低成本,增加销售,利润和顾客忠诚度。为此,历史数据可以通过使用各种分析来提高需求预测方法和机器学习技术,时间序列分析,深度学习模型。在这项工作中,一个智能需求预测系统。这个改进的模型是基于历史数据的分析和解释通过使用不同的预测方法包括时间序列分析技术,支持向量回归算法和深度学习模型。我们所知,这是第一个研究混合深度学习方法,支持向量回归算法,不同的时间序列分析模型由小说决定集成战略需求预测方法。其他新奇的工作是促进整体的适应战略需求预测系统通过实现一个小说决定集成模型。发达系统应用和测试在现实生活中获得的数据从目前市场在土耳其是一个快速发展的公司,6700家门店,1500产品,23个配送中心。广泛的比较和广泛的实验证明,提出的需求预测系统展览值得注意的结果相比,技术发展水平的研究。与技术发展水平的研究,包含支持向量回归,深度学习模型,一种新颖的集成策略,提出了预测系统确保显著地提高精度。

1。介绍

因为零售商之间的竞争日益增加,公司集中更多预测分析技术,以降低成本和提高他们的生产力和利润。过多的库存(库存过剩)和缺货为零售商(缺货)是非常严重的问题。过多的库存水平会导致收入损失,因为公司资本绑定到股票盈余。过多的库存也会导致增加存储、劳动、和保险成本,减少质量和退化取决于产品的类型。脱销的产品可能导致失去销售和减少客户满意度和商店忠诚。如果客户不能找到他们正在寻找的产品在货架上,他们可能会转移到另一个竞争对手或购买替代产品。特别是在中、低水平段,客户的忠诚度是非常困难对于零售商(1]。销售和客户的损失对零售商是一个关键问题。考虑竞争和金融约束在零售行业,是很重要的有一个准确的需求预测和库存控制系统有效的管理操作。面向供应链运作成本和零售商需要优化他们的股票携带更少的金融风险。看来,零售行业在未来将面临更多的竞争。因此,技术工具和预测方法的使用越来越流行和零售商所必需的2]。零售商正在寻找在不同行业自动化的需求预测和补给的解决方案,使用大数据和预测分析技术(3]。有广泛的设置方法和研究领域的需求进行预测。传统的预测方法都是基于时间序列预测方法。这些预测方法预测未来需求基于历史时间序列数据序列的连续数据点测量时间间隔。这些方法使用有限数量的历史时间序列数据相关的需求。在过去的二十年里,数据挖掘和机器学习模型引起了更多的关注和已经成功地应用于时间序列预测。机器学习预测方法可以使用大量的数据和功能与需求和预测未来需求和模式使用不同的学习算法。在许多机器学习方法,深度学习(DL)方法已成为非常受欢迎,最近应用于许多领域,如图像和语音识别、自然语言处理、机器翻译。DL产生了更好的预测方法和结果,相比与传统的机器学习算法在许多研究。整体的学习(EL)是另一个方法来提高系统的性能。 An ensemble system is composed of two parts: ensemble generation and ensemble integration [4]。在整体代部分,多样化的基本预测模型是由使用不同的方法或样品。在集成的部分,所有的预测模型结合使用一个集成的策略。

在这项研究中,我们提出一个新的模型来提高需求预测过程是供应链的主要问题之一。为此,九个不同的时间序列方法,支持向量回归(SVR)算法,构造和DL方法建立需求预测模型。把这些模型对该系统的最终决定,9个不同的时间序列方法,SVR算法,和DL模型是由一个新的混合集成策略,这让我想起提高整体战略。其他新奇的工作是刺激的适应战略需求预测模型。通过这种方式,最终决定提议的系统是基于最好的算法的获得更多的重量。这使得我们更可靠的预测趋势和季节性变化的行为。目前市场上该系统实现和测试真实的数据。实验结果表明,该系统显示明显的准确性对需求预测的改进过程相比,单一的预测模型。在表3,增强了小说的积分法相比,单一的最佳预测模型。我们所知,这是第一个研究来巩固深入学习方法,不同的时间序列分析模型,和一种新型集成战略需求预测的过程。本文的其余部分组织如下:部分2给出了相关工作的总结需求预测,时间序列方法,DL的方法,集成学习方法。部分3描述了拟议的框架。部分4,5,6目前的实验设置、实验结果和结论,分别。

本节给出了总结一些关于需求预测的研究,EL, DL。有许多应用领域的自动需求预测方法在文学。能源负荷需求、运输、旅游、股票市场和零售预测的自动化需求预测的重要应用领域。传统方法用于需求预测时间序列的方法。时间序列方法包括天真法、平均法、指数平滑法,霍尔特的线性趋势法、指数趋势法、衰减趋势的方法,Holt-Winters季节性法,移动平均线,ARMA(自回归移动平均),ARIMA(自回归综合移动平均)模型(5]。指数平滑方法可以有不同的形式取决于使用趋势和季节性组件和添加剂,乘法和阻尼的计算。佩格尔回忆呈现不同的指数平滑方法在图形形式(6]。指数平滑方法进一步扩展的类型加尔省(7)包括加法和乘法衰减趋势的方法。ARMA, ARIMA(也称为Box-Jenkins方法命名的统计学家乔治盒和Gwilym Jenkins)是最常见的方法,找到最适合的模型应用于时间序列的历史价值(8]。

间断需求预测方法试图检测间歇性需求模式具有零个或不同时期的不同需求。间歇性需求模式出现在时装零售、汽车零部件、和制造业。造型断断续续的需求是一项具有挑战性的任务,因为不同的变化。的一个有影响力的Croston提出的关于间断需求预测方法是(9]。Croston的方法使用一种分解方法,使用单独的指数平滑估计需求规模和需求事件之间的时间间隔。其优越的性能在单指数平滑法(SES)方法已经证明了Willemain [10]。Croston的方法来解决一些限制,一些额外的研究由Syntetos-Boylan [11,12)和Teunter、Syntetos Babai [13]。一些应用程序使用多个时间序列,可以组织层级结构,可以组合使用自底向上和自顶向下的方法在不同水平组根据产品类型、地理或其他特性。提出的分级预测框架Hydman et al。14),它提供了更好的预测产生的自顶向下或自底向上的方法。

在供应链环境下,因为有大量的时间序列方法,自动模型选择变得非常重要15]。总选择是单一来源的所有时间序列预测和选择。所有组合的趋势和周期性的影响在加法和乘法形式应考虑。Petropoulos等人在2014年通过回归分析预测的准确性的主要因素进行了分析。李等人介绍了一个修改后的平均绝对缩放误差(RMASE)在他们的研究作为一个新的间断需求预测的精度测量相对误差和与比例无关16]。除了时间序列方法、人工智能方法越来越受大数据技术的发展。研究的初步尝试了加西亚(17]。

近年来,埃尔也很受欢迎和被研究者在许多研究领域。研究的歌,戴18],他们提出了一个新颖的双深极端学习机(ELM)整体系统专注于时间序列预测的问题。在研究Araque et al ., DL开发基于情绪分类器(19]。这个分类器作为基线相比,随后的结果提出两套技术,在情绪总基准分类器分类器与其他表面分析。通等人提出了一种新的软件缺陷预测方法包括两个阶段:深入学习阶段和两级合奏(TSE)阶段(20.]。Qiua提出一个方法(21由经验模态分解(EMD)算法和DL方法都在他的工作。他专注于电力负荷需求预测问题比较不同算法的整体策略。七等人现在的组合Ex-Adaboost学习策略和DL研究基于支持向量机(SVM),提出一种新的支持向量机(DeepSVM) [22]。

在分类问题,学习算法的性能主要取决于数据表示的性质(23]。DL 2006年首先提出了研究的杰夫•辛顿报道重大发明的特征提取(24]。然后之后,DL人员生成许多新的应用领域在不同领域(25]。深度信念网络(DBN)基于限制玻耳兹曼机(元)是另一个代表DL算法(24)层之间有联系,但没有一个人在单位内每一层(24]。起初,实现DBN训练数据以一种无监督学习的方式。DBN学习输入尽可能多的共同特征。然后,DBN可以优化以监督的方式。DBN,相应的模型可以构造分类或其他模式识别任务。卷积神经网络(CNN)是DL的另一个实例(22)和多层神经网络。在CNN,每一层都包含几个二维平面,这是由许多神经元。CNN的主要主要优点是重量在每个卷积层之间共享。换句话说,神经元使用相同的滤波器在每一个二维平面。因此,功能可调参数降低计算复杂性(22,25]。汽车编码器(AE)也被认为火车在一个贪婪的layer-wise深架构的方式(22]。在神经网络(NN)系统,它应该输出本身可以认为作为输入数据。可以获得不同的数据表示原始数据通过调整每一层的重量。输入数据是由编码器和译码器。AE是重建的神经网络输入数据。其他类型的DL方法可以发现在24,26,27]。

我们的工作与上述文学研究的不同之处在于,这是第一个尝试采用不同的时间序列方法,SVR算法,DL需求预测方法的过程。小说最终决定与文献研究的基础上,提出了集成策略来提高需求预测系统的性能。提出的研究可以发现的细节部分3

3所示。提出了框架

本节给出了一个概要的基础技术,如时间序列预测和回归方法,支持向量回归模型,减少功能的方法,深度学习方法,和一个新的最终决定集成策略。

3.1。时间序列和回归方法

在我们建议的系统中,9个不同的时间序列算法包括滑动平均(MA)、指数平滑法、Holt-Winters, ARIMA (28)方法和三种不同的回归模型。在时间序列预测模型,经典的方法是收集历史数据,分析这些数据的潜在特性,并利用该模型预测未来(28]。表1显示了算法和参数定义用于该系统。这些算法是常用的时间序列预测算法需求预测领域。

3.2。支持向量回归

支持向量机(SVM)是一种强大的分类技术基于监督学习理论提出的开发和弗拉基米尔Vapnik [29日]。背景对支持向量机有效取决于早期研究Vapnik和阿列克谢Chervonenkis统计学习理论,对1960年代。虽然甚至最快的支持向量机的训练时间可以相当缓慢,其主要属性是高度精确和能力模型复杂和非线性的决策边界很强大。他们表现出比其他方法更倾向过度拟合。支持向量也可以提供一个非常紧凑的学习模型的描述。

我们还用SVR算法在我们的系统,为连续变量分类回归支持向量机的实现问题。SVR算法被用于连续变量预测问题回归方法,保留了所有的主要属性(最大利润率)以及分类问题。SVR的主要想法是一个线性回归函数的计算在一个高维特征空间。输入数据通过非线性函数映射在高维空间中。SVR已经应用在不同的各种各样的地区,特别是在时间序列和财务预测问题;手写数字识别、说话人识别、物体识别、凸二次规划,损失函数的选择是他们中的一些人(4]。SVR是一个连续变量回归预测方法。在这项研究中,利用SVR预测销售需求通过使用输入变量解释表1

3.3。深度学习

机器学习的方法可以分析功能、关系和复杂的相互作用特性问题的样本数据集和学习模型,可用于预测的需求。深度学习(DL)是一个机器学习技术,适用于深层神经网络架构来解决各种复杂问题。DL已成为一个非常流行的研究课题中研究人员和已被证明提供令人印象深刻的成果在图像处理、计算机视觉、自然语言处理、生物信息学和许多其他领域(25,26]。

原则上,DL是人工神经网络的实现,模拟自然的人类大脑(30.]。然而,深层神经网络更加强大和有能力分析和组成更复杂的功能和关系比传统的神经网络。DL需要很高的计算能力和大量的数据进行训练。最近的改进GPU(图形处理器)和并行体系结构使深层神经网络所需的必要的计算能力。DL使用连续层的神经元,每一层提取更为复杂和抽象与前一层的输出特性。因此,DL可以自动执行特征提取本身没有任何预处理步骤。视觉物体识别、语音识别和基因组学的领域成功应用DL (26]。

一个多层前馈人工神经网络(MLFANN)作为本研究深入学习算法。前馈神经网络,信息从输入节点隐藏节点最后到输出节点连续层的网络没有任何反馈。MLFANN使用反向传播训练随机梯度下降法。它使用梯度下降算法来更新权重报仇雪恨最小化网络输出值的平方误差和目标输出值。使用梯度下降法,每个重量是根据其贡献值调整误差。水深度学习部分图书馆(31日)是人工智能作为一个开源的大数据平台。

3.4。特征提取

在这项工作中,有一些问题,因为大量的数据。当我们试图使用的所有功能在每个商店所有产品155特性和8.75亿条记录,深入学习算法需要几天时间才能完成其工作由于有限的计算能力。为目的,减少特征的数量和每个算法所需的计算时间。为了克服这个问题,加快聚类和建模阶段,PCA(主成分分析)作为特征提取算法。主成分分析是一种常用的降维算法,提出了最重要的特性。PCA变换给定数据集的每个实例从d维空间k维子空间的新生成的k维叫做主成分(PC) (32]。每个主要组件指向最大方差不包括方差,占所有之前的组件。因此,第一个组件覆盖的最大方差等等。总之,表示为主要组件 在哪里个人电脑th主成分,Xj 原始的功能,和一个j数值系数特性吗Xj

3.5。提出了集成策略

决定集成方法在使用不同算法的优势相结合的方式为一个合作法哲学。通过这种方法的帮助下,它的目的是改善的成功提出预报系统通过结合不同的算法。因为每个算法可以更敏感或有一些缺点在不同条件下,收集每个模型的决定提供了更有效和强大的决策过程的结果。

有两个主要的EL方法在文献中,称为同构和异构EL。如果不同类型的分类器作为基本算法,那么这样的一个系统称为异构合奏,否则,同质合奏。在这项研究中,我们专注于异构的集合体。一个系统由两部分组成:合奏一代和整体集成33- - - - - -36]。在整体代部分,不同的模型生成分类器使用不同的基地。九个不同的时间序列和回归方法,支持向量回归模型,深入学习算法作为基分类器在这个研究。有很多基分类器的集成方法,结合决策得到最终决定(37- - - - - -40]。对于集成步骤,提出了一种新的决策集成策略需求预测模型在这工作。我们从提高合奏模式汲取灵感4,41集成策略)来构造我们的提议的决定。提高方法背后的基本概念是,在预测或分类的问题,最终决定可以计算的加权组合的结果。

为了整合每个预测的预测算法,我们使用两个集成策略建议的方法。第一个集成策略选择表现最好的预测方法等,并使用该方法来预测产品的需求在下周的商店。第二个集成策略选择当前一周的表现最佳预测方法和计算预测相结合的加权预测赢家。在我们决定集成策略,最后的决定是由关于贡献所有算法的民主制度。我们的方法考虑决策的预测算法;表现更好的考虑到今年前4周,去年转换当前的星期和前一周。虽然算法得到更好地预测的时候,他们的贡献权重相应增加,反之亦然。在第一个决定集成策略,我们不考虑贡献的算法完全民主的方式;我们只看贡献最好的算法有关。换句话说,最终决定是通过集成决策维护仅有的最好的选择(根据他们的历史决策)为每个存储和产品。 On the other hand, the best algorithms of a week can change according to each store, product couple, since every algorithm has different behavior for different products and locations.

第二个决策集成策略是基于平均绝对百分比误差的加权平均(日军)和平均绝对偏差(疯了)42]。这是两个流行的评价指标来评估预测模型的性能。这些预测方程的计算精度的措施如下:

日军(平均绝对百分误差)

疯了(平均绝对偏差)

在哪里(我) 是预期的或估计价值 (2) 是周期t的实际价值(3)n的值也正在时期的数量

模型的准确性可以简单地计算如下:= 1-MAPE准确性。如果上述两个指标的值很小,这意味着预测模型性能更好(43]。

补充需求预测在零售行业需要一些修改一般EL策略,关于零售特定趋势和动态。为此,提出第二集成策略需要计算的加权平均每周的日军前4周,另外日军前一年的同一周,前一年下周的趋势方程(4)。这使得我们更可靠的预测与趋势变化和季节性的行为。每周日军正在定义的公式计算出方程(2)以上。该模型自动变化每周每个成员的权重算法的平均每个星期在日军的商店和产品水平。根据日军重量的结果,本周最好的算法获得更多的重量,最终决定。

平均每个算法的日军一个产品在每个存储与计算方程(4)。假设映射算法的0.2,0.3,0.1,0.1前4周当前周和0.1和0.2的前一年的同一周,之前一周。假设每周系数是25%,20%,10%,5%,30%,和10%,分别。然后,每周平均日军一个算法对当前将0.3 0.25 + 0.3 0.2 + 0.1 0.1 + 0.1 0.05 + 0.1 0.3 + 0.2 根据方程(0.1 = 0.24)。 在方程(4),系数的总和应该1;也就是说, 意味着日军相关周,(我)1是前一周的日军(2)2星期前2周的日军相关吗(3)3星期3星期前的日军相关吗(iv)4星期前4周的日军相关吗(v)5是前一年的同一周的日军(vi)6是前一年的日军的前一周吗

该决策集成系统计算每个算法预测未来一周的日军/商店和产品水平。此外,特殊的日子的影响考虑在内。圣诞节,情人节,母亲节,和其他宗教天的斋戒月开始可以被认为是特殊的日子的一些示例。系统用户,考虑到今年的日历,可以手动定义特殊的日子。因此,特殊的日子的趋势计算自动通过前一年的趋势。这使得考虑季节性和特殊事件的结果的评价更准确的预测价值。与此同时,可以考虑季节性和其他影响,。在日军的计算算法,新的权重(W在哪里i = 1 . . n)被分配给每个人根据他们的加权平均为当前的星期。

下一步是最好的算法的定义为每个商店和产品两周。我们只考虑30%的表现最好的方法是最好的算法。后许多实证观察,这个比例是根据数据给出最终结果。很明显,这些参数也非常具体的数据集特征和依赖于算法中包含集成策略。比例是最后进行预处理的计算最终决定预测。假设我们有n算法(一个1,一个2,…n),k都是一周中最好的模型存储和产品的夫妇,在其中 每个冠军的重量比例根据其加权平均在方程(5)。 假设有三个最好的算法和它们的重量 , , ,分别。他们攀登新的权重会 分别根据方程(5)。

扩展使我们计算更易于理解。扩展每个的重量算法后,系统可以根据新的权重考虑最终决定每个算法的性能与方程(5)。 在方程(7),主要的约束 , 冠军数的算法,和F1天气预报的相关算法。假设是一个表现最好的算法1,一个2和一个3和算法120和预期销售数量2说,它将于下周十;一个3预计是5。让我们假设他们的权重比例是50%,30%,和20%,分别。然后根据方程(加权预测如下7): 每个算法都有投票权利根据其重量。最后,如果一个成员算法并没有出现在列表中最好的算法的产品和商店夫妇在一个特定时期内,它是自动放入黑名单,这样它将不再被使用了一个产品,存储水平是显著的。这使更快的计算时间系统忽视了表现不佳的算法。提出的算法需求预测系统,该系统给出了算法的流程图1和图1,分别。

鉴于:n是商店的数量,是产品的数量,t的数量是
系统和算法 指数是一种算法t 是矩阵
包括表现最佳的数量为每个存储算法,和产品,
矩阵包含黑名单的设置为每个存储算法,和产品
是商店的矩阵每个预测的最终决定在哪里的数量是
商店和j是产品的数量。
i = 1: n
j = 1: m
k = 1: t
如果 在列表 然后继续
其他运行
算法计算重量
如果
结束了
k = 1: t
表现最佳的选择算法和定位
结束了
对z = 1:
做缩放
结束了
计算提出了集成策略,并存储
结束了
结束了
返回所有

4所示。实验设置

我们使用一个增强的数据集,包括现实生活目前市场的销售和库存数据与丰富的特性。数据集由106周的销售数据,其中包括7888种不同产品,不同的商店目前市场。在每个商店,约有1500产品正在积极出售其余很少变得活跃。每周的预测执行预测下周的需求。三倍交叉验证方法适用于测试数据,然后决定准确的其中一个最好的未来下周预测。这是一个常见的方法在零售需求预测(44]。此外,外面天气信息,比如每日温度和其他天气条件,作为新变量加入到模型中。因为众所周知,购物的趋势有一定的相关性,在大多数情况下,天气条件在零售(33),我们丰富了数据集的天气信息。数据集还包括主要销售相关特性与关系遗留数据源。

深度学习的方法是用来估计每个产品客户需求在每个商店目前市场零售连锁店。也有很明显的相似产品之间,大多是在同一个篮子的销售趋势。为此,先验的算法(4是用来找到每个产品的相关产品。先验的算法是一种快速的方法找出最相关的产品在同一篮子里。最相关的产品的销售相关的功能被添加到数据集,。这需要的优势产品类似的销售趋势之间的关系。添加相关产品的产品和它的特性使DL算法更好地学习在不同的隐藏层。总之,在广泛的实验,观察到增强的训练数据集与气象数据和大多数相关产品销售数据使我们估计的使用更强大的DL算法。

每个产品的数据集包括每周的基础数据在每个商店最新的8周和最后4周的销售数量在同一季节。从历史上看,2年的数据包括为每个5500家门店和1500种产品。在155特性数据大小大约8.75亿条记录。这些特性包括销售数量,客户返回数量、收到产品数量从配送中心,销售数量,折扣金额,收到产品的数量,客户购买特定产品的数量、销售数量每天星期(星期一、星期二、等等),最大和最小库存水平的每天,每周平均库存水平,销售数量每小时的天,还销售数量的同一季节的最后4周。由于产品之间的关系通常是在同一个篮子,我们准备相同的功能上面定义为最相关的产品,。数据集提出了表的详细解释2

在表2领域特定的方括号意味着它是一个数组每星期(例Sales_quantity_week_0意味着销售数量的当前的星期和sales_quantity_week_1是前一周的销售数量等等)。关于实验结果,采取每周最新的8周和4周的数据在去年同样的赛季给更多可接受的季节性变化趋势。

水库(DL实现部分31日)是人工智能作为一个开源的大数据平台。水是一种强大的机器学习库和给我们机会实现DL算法Hadoop火花大数据环境。它把在一起的力量高度先进的机器学习算法,提供真正的好处可扩展内存中处理火花大数据环境中一个或多个节点上通过其特有的苏打水。在内存中处理能力激发技术的帮助下,它提供了更快的并行平台利用大数据业务需求得到最大的好处。在这项研究中,我们使用水3.14.0.2在64位版本,推出这种,32 gb内存机器观察并行性的力量在DL造型而增加神经元的数量。

一个多层前馈人工神经网络(MLFANN)采用深学习算法。MLFANN使用反向传播训练随机梯度下降法。使用梯度下降法,每个重量是根据其贡献值调整误差。水也高级功能(如动量培训、自适应学习速率,L1和L2正规化,退火,辍学,和网格搜索。应用高斯分布的连续变量作为响应变量的使用。水在我们的环境中执行得很好当3级隐藏层,他们每个人10节点,并完全300时代作为参数。

实现降维后一步,采用k - means聚类算法。k - means是一个贪婪和快速聚类算法(45]试图样本分割成每个样本的k集群集群中心附近。K是选为20,因为经过几次试验和经验观察,达到最均匀分布的数据集,数据集划分为20个不同的集群为每个商店。这部分后,深度学习算法,获得了20个不同的DL模型为每个商店。然后,每个产品需求预测是由使用它的集群存储基础上的模型。使用集群的最主要的原因是时间和计算缺乏DL算法。而不是让每个商店造型,20模型生成的每个商店在产品水平。我们的试验样本数据集的偏见差异小于2%,所以这加速是研究人员非常有益的和一个很好的选择。DL模型的预测结果转移到我们的预报系统,使其最终决定通过考虑11预测方法包括DL模型的决策。

预测解决方案应该是可伸缩的,处理大量的数据,从数据中提取模型。大数据环境下使用火花技术给我们机会实现算法和机器学习算法的可扩展性,任务之间的并行体系结构的节点。考虑大量的样本和大量的功能,即使并行体系结构的计算能力在一些情况下是不够的。出于这个原因,需要降维大数据的应用程序。在这项研究中,采用PCA特征提取步骤。

5。实验结果

预测解决方案应该是可伸缩的,处理大量的数据,从数据中提取模型。大数据环境下使用火花技术给我们机会实现算法和机器学习算法的可扩展性,任务之间的并行体系结构的节点。考虑大量的样本和大量的功能,即使并行体系结构的计算能力在一些情况下是不够的。出于这个原因,需要降维大数据的应用程序。在这项研究中,采用PCA特征提取步骤。

目前市场销售21不同组的项目。我们评估小组的基础上提出了预测系统的性能如表所示3。表3显示了日军(平均绝对百分误差)的集成策略1)和(22和3)列。策略的平均预测误差百分比(S1)和(2分别为0.42和0.26)。从表可以看出3的百分比的成功率(S2)依照(S1列5)表示。当前集成策略(S2)提供了提高38.99% /第一个集成策略(S1)的平均水平。在纺织品等产品组,错误率降低从0.54到0.31,日军增强43.74%。

这项工作,进一步提高了利用DL模型相比,使用10算法基于预测策略。列4表3演示了地图后的21个不同组的产品添加DL模型。DL包容后提出的系统模型,我们观察到约2%到3.4%增加需求预测精度的产品组。一些产品组的错误率,像“婴儿产品”,“化妆品”,和“日用品”通常比其他人更高,因为这些产品组没有连续的消费者的需求。例如,“日用品”小组的错误率是0.35而“红肉”小组的错误率是0.15。食品通常较低的错误率,由于客户考虑日常消费经常购买这些产品。然而,婴儿的错误率较高,纺织品,家居用品。从这些团体根据客户购买的产品是否他们喜欢的产品选择性。此外,商品的价格在这些组织和推广效果通常高相对于商品的价格在其他组。

此外,它是观察到前受益产品组的方法我在婴儿产品实现超过40%的成功率,烘焙产品,食用油,家禽鸡蛋,准备好饭菜,和纺织品的列百分比成功率进行了分析。这些团体的共同观点是,每个人都是被一个特定的客户部门,定期。例如,婴儿产品组是由家庭的孩子选择;食用油、禽蛋和面包店产品被频繁和持续购物首选客户群体;和即食餐被大多喜欢单身,单身,和工作的消费者,等。此外,包含的DL预报系统表明,其他消费群体(例如,清洁产品、红肉和豆类面条汤)表现出更好的性能比其他的额外的3%以上。

2显示了箱形图的平均百分比误差(日军)每组后应用程序的产品1)集成策略。盒子里的情节使我们能够分析预测错误产品组的分布特征。从图可以看出,每个产品组有不同的中位数。因此,预测错误通常是不同的对于不同的产品组。四分位范围框代表中间50%的得分数据。四分位范围框的长度通常是非常高的。这意味着有许多不同的预测错误在一个给定的产品组。

3介绍了箱形图的地图提出了预测系统,应用提出的集成方法(S2)相结合的预测10个不同的预测算法。

4DL添加到我们的系统后显示结果。四分位范围盒子的长度是窄相比的数字23。这意味着预测误差小于数据的分布23。最后,DL融入该预报系统产生的结果更准确。

例如,(S1)在婴儿产品集成策略产品组日军分布数据的第一个四分位数5是观察之间的0%和23%,2 23%和48%之间的四分位数,和图3日和4日在48%和75%之间2。婴儿产品产品的应用集成策略组后,日军分布成为第一个四分位数的0% - -16%,16% - -30%为第二个四分位数的数据,并为剩下的30% - -50%。这给第一四分位数提高约8%,从8%到18%增强第二象限,从18%到25%,进步的数据根据边界的差异。中位数的日军分布分析了48%。应用提出的集成策略后,观察到27%,这意味着提高21%。大约1% -3%增强观察每个四分位数的数据包含的深层学习策略在图4

清洁产品,与其他有类似的改进;一体化战略的日军第一象限的分布之间观察到的数据是0%和19%,为第二个四分位数之间的19%和40%,和其他数据在图观察到40%到73%之间2。在执行提出了清洁产品集成策略之后,日军分布成为第一个四分位数数据的0% - -10%,为第二个四分位数10% - -17%,27% - -43%的3日和4日四分位数。改进观察如下:9%第一个四分位数,第二象限从9%到13%,从13%到20%的数据边界。实施后的集成策略1号和2号四分位数,观察到的系统发展为2%,和3日和4日四分位数% 3,分别。简单、集成策略改进是为每个产品组显著,DL的整合提出了集成策略进步结果近2%至3%,此外。

在图5集成策略中,准确性比较提出了一个表现最佳的样本组1年期间。特别是圣诞节和其他季节性效应可以很清楚地看到在图5和集成策略与DL ( )表现最好的准确性。

很难比较提出了系统的性能和其他的研究由于缺乏使用类似的组合深度学习方法,提出决策集成策略和不同的学习算法需求预测的过程。另一个困难是真实数据集类似于目前的缺陷数据集为了比较先进的研究。尽管提出系统给出的结果在这项研究中,我们报告的结果在需求预测领域的研究工作。贪婪aggregation-decomposition方法解决了一个真实的间断需求预测问题时装零售商在新加坡46]。他们报告5.9%日军成功率与一个小数据集。作者比较不同的方法,如统计模型,冬天模型和半径基函数神经网络和支持向量机(时滞)大小需求预测过程中(47]。结果,他们的结论是这一事实的研究支持向量机算法的成功超过其他增强日军结果平均水平7.7%左右。小说的需求预测模型称为SHEnSVM(支持向量机)的选择性和异构合奏提出了(48]。拟议的模型提出了不同的单个支持向量机训练样本由引导生成算法。之后,遗传算法用于检索是最好的个人组合模式。他们报告10%进步与日军的改进支持向量机算法和64%。他们只使用在他们的实验数据与三种不同品牌啤酒。Tugba Efendigil等人提出一种新颖的预测机制建模的人工智能方法在49]。他们比较人工神经网络和自适应基于网络的模糊推理系统技术管理的模糊和不完整的信息需求。他们到达18%左右日军利率部分产品在他们的实验。

6。结论

在零售行业,需求预测是供应链的一个主要问题来优化库存,降低成本,并增加销售,利润和顾客忠诚度。为了克服这个问题,有几种方法,如时间序列分析和机器学习方法来分析,从历史数据学习复杂的交互和模式。

在这项研究中,有一个小说试图整合11种不同的预测模型,包括时间序列算法,支持向量回归模型,深入学习方法对需求预测的过程。此外,小说决定集成策略是由灵感从整体方法,即提高。该方法考虑了每个模型在时间和性能表现最佳结合的加权预测模型对需求预测的过程。提出了预测系统进行测试和现实生活中获得的数据从目前市场零售连锁店。它是观察到的不同的学习算法除了时间序列模型和一种新颖的集成策略高级需求预测系统的性能。我们所知,这是第一个试图巩固深入学习方法,SVR算法,不同的时间序列方法对需求预测系统。此外,其他新奇的这项工作是促进整体的适应战略需求预测模型。通过这种方式,最终决定提议的系统是基于最好的算法的获得更多的重量。这使得我们更可靠的预测趋势和季节性变化的行为。此外,该方法执行很好结合深入学习算法火花大数据环境。 Dimension reduction process and clustering methods help to decrease time consuming with less computing power during deep learning modelling phase. Although a review of some of similar studies is presented in Section5预计,很难比较其他研究的结果与我们,因为使用不同的数据和方法。在这项研究中,我们比较三个模型,模型的结果选择表现最好的预测方法根据其成功前期日军平均为42.4%。第二个模型与小说集成策略结果平均在25.8%日军。最后一个模型与小说集成策略增强深度学习方法提供了平均24.7%的日军。深度学习方法的结果,包含到小说集成策略降低平均预测误差在供应链需求预测过程。

作为一个未来的工作,我们计划丰富的集合特性通过收集数据从其他来源经济研究、购物趋势,社会媒体,社交活动,建立人口数据的存储位置。新深度学习各种数据源的贡献可以观察到。一个可以做更多的研究来确定hyperparameters深学习算法。此外,我们还计划使用其他深度学习技术,如卷积神经网络,复发性神经网络和深层神经网络学习算法。此外,我们的另一个目标是使用启发式方法MBO(候鸟优化)和其他相关算法(50)优化的一些系数/重量决定经验的试错像30%表现最佳的方法在我们当前的系统。

数据可用性

这个数据集是私人客户数据,所以同意组织目前不允许共享数据。

的利益冲突

作者宣称没有利益冲突有关这篇文章的出版。

确认

这项工作是由OBASE研发中心。