输入向量为代表<我nline-formula>
Y
j
用<我nline-formula>
Y
j
=
y
1
,
y
2
,
y
3
,
⋯
,
y
n
;<我nline-formula>
W
j
k
j
=
1
,
2
,
3
,
⋯
,
n
;
k
=
1
,
2
,
3
,
⋯
,
米
的连接权向量<我nline-formula>
j
输入层的节点<我nline-formula>
k
隐层的节点;<我nline-formula>
X
k
k
=
1
,
2
,
3
,
⋯
,
米
的向量<我nline-formula>
k
隐层神经元;<我nline-formula>
W
k
k
=
1
,
2
,
3
,
⋯
,
米
的连接权重<我nline-formula>
k
隐层到输出层的节点;和<我nline-formula>
Y
的单位输出向量是一个输出神经元的神经网络。<我nline-formula>
Θ
k
k
=
1
,
2
,
3
,
⋯
,
k
偏差值的隐层节点和<我nline-formula>
Θ
的偏差值是输出层。
隐层的输出是由公式
(1)
X
k
=
f
Σ
j
=
1
n
W
j
k
Y
j
+
Θ
k
。
输出层的输出是由公式
(2)
Y
=
f
Σ
k
=
1
米
W
k
X
k
+
Θ
,
在哪里<我nline-formula>
f
隐层和输出层的激活函数。
输入数据包括七(7)输入基于落后2010年至2016年的年度月度需求。神经网络的输入和输出数据列于表
1。在这里,我们假设对下个月的需求是一个函数的前几个月的过去值记录在同一时间。模型方程所代表的普遍方程(
3)。
(3)
y
t
+
12
=
f
y
t
,
y
t
−
12
,
y
t
−
24
,
y
t
−
36
,
y
t
−
48
,
y
t
−
60
,
y
t
−
72年
+
Θ
t
+
12
。
样本,神经网络的输入和输出数据。
一年
2010年
2011年
2012年
2013年
2014年
2015年
2016年
2017年
月
y
t
−
72年
y
t
−
60
y
t
−
48
y
t
−
36
y
t
−
24
y
t
−
12
y
t
y
t
+
12
1月
1790年
2152年
2299年
2288年
2232年
1954年
1804年
1724年
2月
1602年
2095年
2196年
2238年
2092年
1853年
1770年
1603年
3月
1939年
2238年
2291年
2413年
2254年
2003年
1858年
1753年
4月
1955年
2214年
1933年
2073年
2043年
1813年
1805年
1637年
可能
2049年
2215年
2155年
2261年
2106年
1832年
1732年
1674年
6月
1949年
2253年
2209年
2246年
2059年
1758年
1719年
1554年
7月
2000年
2274年
2404年
2093年
2207年
1869年
1760年
1724年
8月
2046年
2255年
2486年
2214年
2119年
1834年
1748年
1650年
9月
2118年
2419年
2446年
2247年
2044年
1818年
1788年
1583年
10月
2247年
2011年
2441年
2289年
2132年
2033年
1810年
1649年
11月
2193年
2446年
2235年
2197年
1971年
1898年
1762年
1626年
12月
2245年
2353年
2387年
2289年
2018年
1952年
1779年
1674年
y
t是观察到的值为当前月的需求,<我nline-formula>
y
t
−
12
前一个月的需求价值,等等,同时吗<我nline-formula>
y
t
+
12
是下个月的需求,<我nline-formula>
Θ
t
+
12
是相关的偏见。(
33)实现同样的方法在他的年度总电力需求预测的研究。输入的最优数量的选择是基于试验和错误(所
34]。
2.2.1。数据预处理
先安在设计,数据预处理模型拟合。预处理代表数据编码、浓缩和净化涉及占噪声和处理丢失的信息。预处理还涉及数据的正常化(按比例缩小)间隔(0,1)为了防止饱和的隐藏节点之前喂到神经网络(
1]。有三种基本正常化技术可用于数据预处理,即;min-max正常化,<我nline-formula>
Z
分数正常化,乙状结肠正常化技术根据(
14]。使用最小最大输入值是正常标准来优化神经网络模型的收敛速度。最小最大标准可以普遍的公式:
(4)
y
t
′
=
y
t
−
最小值
y
t
马克斯
y
t
−
最小值
y
t
,
在哪里<我nline-formula>
y
t
的月度需求时间<我nline-formula>
t
,<我nline-formula>
y
t
′
正常价值的时间<我nline-formula>
t
,<我nline-formula>
最小值
y
t
和<我nline-formula>
马克斯
y
t
最小和马<我nline-formula>
′
分别ximum值的变量<我nline-formula>
y
t
在数据的范围。
神经网络的体系结构是由隐层和输出层的数量,神经元的数量在所有的层,训练算法参数和性能指标。没有一般规则的选择适当数量的隐藏层和最受欢迎的方法找到最优隐层数是通过试验和错误(
35]。神经网络的体系结构可以通过方程(普遍
5)。
(5)
我
−
H
1
,
H
2
,
H
3
,
⋯
,
H
n
−
O
,
在哪里<我nline-formula>
我
代表输入节点的数量,<我nline-formula>
H
n
在隐层神经元的数目<我nline-formula>
n
,<我nline-formula>
O
输出层神经元的数目。一个例子是一个安在七(7)输入节点,一个隐藏层神经元三(3),和一个(1)输出神经元可以表示成7 - 1(3),分别。
隐藏层和神经元的数量选择过程的系统变化为了获得最准确的模型提出的(
17]。重要的是要注意,神经网络没有隐藏的单位是等价的线性统计预测方法(
40]。隐藏的单位执行输入和输出变量之间的映射,以及提供神经网络的非线性特性,除了发现模式的数据集(
7]。选择最好的三个模型中神经网络是基于性能的措施,也就是说,平均绝对误差(MAE)和均方误差(MSE)。MSE的配方、RMSE和由美
(7)
均方误差
=
1
N
Σ
t
=
1
N
y
t
−
y
^
t
2
,
(8)
RMSE
=
1
N
Σ
t
=
1
N
y
t
−
y
^
t
2
,
(9)
美
=
1
N
Σ
t
=
1
N
y
t
−
y
^
t
,
在哪里<我nline-formula>
y
t
是实际观察的<我nline-formula>
t
,<我nline-formula>
y
^
t
同一时期的预测<我nline-formula>
N
测试集的长度。MSE和梅都是精度的措施和扩散的程度的数据点
7]。美是一种测量距离预测到实际的数据点,平均绝对误差(
18]。从训练样本值预测和价值观在测试集利用计算性能的措施。预估2018年计算通过使用最好的重量值获得所选模型。
当开发一个使用Box-Jenkins ARIMA模型方法,必须遵循四个阶段:识别、评估、诊断和预测。时间序列数据的组件,即季节性、趋势,循环性,和不规则模型开发的关键。季节性是指一个一致的形状的系列反复周期性规律。它也可以称为定期上下波动或短期变化由于季节性因素。每月救护车电话数据每年可能会有强烈的组件发生滞后的倍数<我nline-formula>
年代
=
12
强大的关系,因为历年的活动。这可能导致采用自回归和移动平均多项式认同季节性滞后叫做乘法季节性自回归综合移动平均模型(
42]给出的ARIMA (p, q, d) x (p d q)。可以编写模型的一般形式
(10)
Φ
p
B
年代
ϕ
B
∇
年代
D
∇
d
Y
t
=
Θ
问
B
年代
θ
B
w
t
,
在哪里<我nline-formula>
w
t
时间价值<我nline-formula>
t
白噪声,<我nline-formula>
Y
t
的观测值的时间吗<我nline-formula>
t
,<我nline-formula>
ϕ
B
=
1
−
ϕ
1
B
−
ϕ
2
B
2
−
⋯
−
ϕ
p
B
p
普通的自回归部分订单吗<我nline-formula>
p
,<我nline-formula>
θ
B
=
1
+
θ
1
B
+
θ
2
B
2
+
⋯
+
θ
问
B
问
是普通的移动平均线的组成部分<我nline-formula>
问
,<我nline-formula>
∇
d
Y
t
=
1
−
B
d
Y
t
订单的普通差分量吗<我nline-formula>
d
,<我nline-formula>
∇
年代
D
=
1
−
B
年代
D
是订单的季节性差异<我nline-formula>
D
在滞后<我nline-formula>
年代
,<我nline-formula>
Φ
p
B
年代
和<我nline-formula>
Θ
问
B
年代
是订单的季节性自回归和移动平均线的区别<我nline-formula>
P
和<我nline-formula>
问
在滞后<我nline-formula>
年代
,分别。
在选择最好的模型从每个FFNN和SARIMA模型,生成的每月2018救护车需求量的预测模型的交叉验证的目的。预测值和实际值用于计算每个模型的性能使用平均绝对误差(MAE)和均方根误差(RMSE)作为性能的措施。美以相同的权重差异从实际值而RMSE入账的这些差异和一个巨大的惩罚是更适当的识别异常值(
7]。这使得美一个更合适的工具测试拟合优度RMSE相比。配对样本<我nline-formula>
t
以及(在5%显著性水平)进行了验证实际值和预测值之间的任何显著差异的两个模型使用一款统计软件统计软件包。适合的模型,不应当有实际值和预测值之间的显著差异(<我nline-formula>
p
>
0.05
)。使用选定的高级模型,预估2019年和推论进行扣除。
性能的措施,美和配对样本<我nline-formula>
t
以及,表明FFNN模型优于传统的SARIMA模型时间序列预测的救护车在布拉瓦约的需求,在短期预测范围内。发现FFNN模型更倾向于价值估计SARIMA模型相比,定向所描述的线性模式。因此,FFNN模型的模型预测精度来自这个独特的特征。FFNN模型构建过程使用了96的观察,七十二年(72年)和20(24)观察被用作训练集和测试集,分别。这样的小样本数据,可以得出结论,FFNN模型能够实现准确的预测,因为它能够检测时间序列的隐藏模式比SARIMA模型。SARIMA模型需要满足平稳性的假设模型建立之前,也被验证模型发展。然而,这种假设不需要在FFNN的发展。因此,FFNN是吝啬的,简单的模型没有假设,在模型建立需要较少的变量,但更大的解释力和SARIMA模型。观察,使用一个隐层的架构产生比获得更准确的结果与两个隐藏层架构短期预测的视野。因此,一个隐层的使用是足够的发展中FFNN短期预测的视野。 Reducing the number of input neurons did not improve the model accuracy. The researchers recommend that Bulawayo City Council should deliberately adopt and integrate such forecasting tools to assist them in their strategic resource planning activities.