文摘
一个困难的研究领域是金融时间序列预测。介绍了时间序列和模糊神经网络的发展本文也进行深入研究当地的金融时间序列预测。下一步是提出和建立一个本地基于金融时间序列的模糊神经网络预测模型。矩阵的伪逆更新使用岭回归在这项研究为了更新网络参数。本文提供了相应的增量算法来更新网络参数随着训练输入数据或模糊规则的增加,避免参数再培训的必要性。本文采用MATLAB仿真和比较分析,以验证这种方法的可行性和可靠性。根据模拟结果预测精度96.31%,9.84%的预测精度比传统的神经网络算法。在金融时间序列预测方面,本文中提出的模型性能更好。金融时间序列预测模型的性能进一步提高,弥补之前研究的不足。此外,它有助于相关研究领域的金融时间序列预测。
1。介绍
时间序列是按时间顺序排列的数字数据集合。为了充分探索中的所有信息数据和实现的目标预测将来事情会如何发展,这组数据的时间序列分析竣工使用数理统计(1]。在现代环境中,当面对大量的时间序列数据,人们寻找高效的技术或方法发现的知识或信息隐藏在这些时间序列数据集,建立时变系列模型,预测未来使用一组规则(2]。金融时间序列数据的预测是一个困难的研究课题,因为金融时间序列数据通常包含大量的噪音和清楚地表明非线性和非平稳的复杂特征。利用历史观测数据的小样本大小,时间序列预测创建一个模型,该模型可用于控制和预测数据,阐明数据统计规律。在社会交往和学术研究中,时间序列预测是至关重要的(3]。的研究领域和困难在大数据领域的分析和管理科学,它可以提供重要的理论基础和强大的数据支持决策分析和决策。在金融行业,特别是时间序列分析中经常使用的应用程序像风能预测、交通流预测,水位预测。获得更好的预测结果也可以通过使用计量经济学,机器学习等技术来预测金融时间序列数据。尽管越来越多的学者使用神经网络(神经网络)的基础4- - - - - -6)时间序列分析,因为它是更适合非线性和并行数据预测,大部分神经网络用于时间序列预测,如延时(多层感知器)和RBF(径向基函数)网络基于BP (7),是基于这样一种认识,有历史数据之间的线性或非线性关系和未来值。这些系统试图确定是否存在一个线性或非线性关系和表达的历史和未来状态使用功能。
预测是研究事物的未来发展和运营法律使用定性和定量的方法,如数学、统计学、经济学、计算机、工程技术的基础上掌握相关信息。此外,测量、描述和评估各种组件的变化趋势,越来越多的互联网金融公司已经建立了网络金融的增长的结果。为了防止损失带来的高风险借款人贷款,这些金融公式预测用户的信用历史还款时间序列的基础上用户。今天有许多技术和建立技术可用平稳时间序列的建模和预测,尤其是对线性模型的研究。尽管目前还没有完美的方法来分析和处理这些时间序列,不能产生预期的结果,大多数时间序列在实际问题不稳定和线性8]。的变量影响金融时间序列数据变化的短,中,长期是复杂和多样化。许多时间序列预测系统使用延时或RBF网络模型训练网络预测期之后为了适应网络现状(9]。然而,一些时间序列系统可能会表现出不同的特征在不同的时间点。预测网络的结构和参数必须能够在整个预测过程中不断改变。当地的金融时间序列预测彻底检查,和当地的一个基于模糊神经网络的预测模型(模糊神经网络)提出和构建。以下是本文的创新。(1)模糊神经网络的结构、学习方法和算法用于创建、修剪和聚合普通节点是本文的主要议题。模糊神经网络,模糊参数的初始化执行使用限制玻耳兹曼机,最小化参数随机性的影响,然后学会了使用网络参数学习速率和比例因子。模型的分类精度提高,迭代的数量减少,通过自适应调整学习速率。结果证明该算法产生准确的分类结果的能力。(2)为了建立一个金融时间序列数据的预测模型基于不同频率和波动,金融时间序列数据分解和重构趋势而言,低频术语,高频术语在本研究中使用集成经验模态分解和运行周期的判断方法。预测的结果然后集成各种组件生成最终的预测结果。传统的金融时间序列模型和其他非线性模型与FNN-based金融时间序列预测模型。发现FNN-based金融时间序列预测模型在本文中执行如预期和提供了一些优势竞争模型。
本文分为五个部分,每个组织不同,按照需求的研究:导论部分是第一部分。本节概述论文的的历史、论文和研究意义以及它的创意和组织设计。一个相关的部分是第二个。金融时间序列和神经网络的研究现状国内外在本节简要讨论。最后,论文的观点和研究成果。第三部分定义了模糊神经网络和描述其基本结构和学习算法,讨论了金融时间序列的相关内容。模糊神经网络的基础上,一个当地的金融时间序列预测模型。模型的仿真算法提出本文在部分4,结果是检查和讨论。实验表明,提出的模型作品。结论在第五部分。本文总结了所做的工作在这一节中,也向前看。
2。相关工作
在学术界的研究热点,如何建立有效的预测模型,实现时间序列的有效预测时间序列预测的核心创新研究。目前,许多学者已经讨论了它。
许等人应用BP神经网络的时间序列预测股票,然后将它与其他三个预测算法(10]。结果表明,BP神经网络模型更适合股票时间序列的预测,预测更准确。殷等人提出了一种数据驱动的神经网络预测模型(11)的问题,传统的统计模型不能准确地描述实际系统的复杂非线性特征。·施努尔应用径向基神经网络的预测汇率和获得更准确的预测汇率的12]。万纳等人提出了一种基于模糊神经网络的时间序列预测模型。然后,基于金融时间序列预测模型结合模糊神经网络和GARCH,特定的混合模型给出的数据,上海证券交易所指数(13]。么使用Elman-NN预测股票综合指数预测(14]。结果表明,绝对平均误差和最小平方误差预测值与实际值之间都是规模较小的,可以更好地适应股票的实际价值综合指数系列。Wiesinger等人提出了模块化的建模概念和框架,介绍了时间序列预测的研究(15]。基于数据预处理模块的建设,优化模块,和预测模块中,一系列的混合预测框架成功提出了时间序列预测的研究。戴森提出一种改进的Elman-NN模型通过引入时间权重和随机性因素Elman-NN模型(16]。它提高了现有Elman-NN时间序列数据的预测精度。莫等人介绍了一个基于进化的时间预测系统模糊神经网络(17,18]。许等人提出的进化模糊神经网络是一个模糊神经网络模型(19]。它使用一个前馈神经网络来处理模糊数据;然后,解模糊数据作为输出。
本文提出和发展FNN-based当地金融时间序列预测模型基于之前文献的深入分析。模糊神经网络,模糊参数的初始化执行使用限制玻耳兹曼机,最小化参数随机性的影响,然后学会了使用网络参数学习速率和比例因子。模型的分类精度提高,迭代的数量减少,通过自适应调整学习速率。本文结合增量学习和岭回归的训练模糊神经网络由于随着时间的推移越来越多的输入数据。研究表明,FNN-based金融时间序列预测模型用于本文执行预期的水平和提供了一些优势竞争模型。这说明该模型的有效性。本文的研究具有重要的实际意义。它对解决更多的实际问题具有重要的实用价值。
3所示。方法
3.1。金融时间序列预测
以满足社会和经济发展的要求和管理,预测是产生和发展的社会活动。预测已经成为一个全面的学科在不断发展和进步20.]。分类和估价的一般方法是预测。换句话说,预测通常获得通过分类或估值模型,然后应用该模型预测未知的变量。为了提高社会效益和经济效益,降低管理风险,这是至关重要的跨越自然科学和社会科学之间的边界。这样做可以帮助人们做出明智的决定,并为他们的未来提供指导行为。一组随机变量按年代排列称为时间序列。只有小的观测时间序列作为样本数据在实际问题中,时间序列分析的主要目标是选择最适合的数据的统计模型考虑了观测数据的特性。然后预测的目标是通过使用模型的统计特性来解释数据的统计规律(21]。事物的发展规律可以被理解和应用通过研究时间序列,它可以是非常有用的在我们的日常生活中。了解时间序列是至关重要的。
时间序列可分为单变量和多变量时间序列取决于许多变量中所包含的信息。多变量时间序列是多维系列,其价值随着时间的变化,而不是变量时间序列,一维系列值随着时间的变化。在进化的过程中,许多实际时间序列没有固定和不舒服的平均值。然而,序列做展览一些除了同质性的地区差异。如果我们做出正确的调整过程,我们可以稳定和创建一个模型来表示齐次非平稳的特性。乍一看,很多时间序列似乎遵循任何规则,但大量的数据表明,时间序列经常可以叠加所产生的许多不同的形式。时间序列通常有一个系统的部分和一个nonsystematic部分。其中,趋势、季节性和周期性的组件构成了系统的一部分,而突然的变化和随机变化组件构成nonsystematic部分。数据之间的线性函数关系使得传统的时间序列模型易于理解。然而,没有理论证明了给定的一组时间序列必须满足线性或扩展任何类型的预测函数。 The main components of a time series are the period to which the phenomenon belongs and the variables that reflect the phenomenon’s stage of development. Time series prediction involves predicting the sequence values of the subsequent time based on the sequence values of the current time and one or more previous times. Time series are created through a random process. The process of predicting future outcomes using an established mathematical model that is based on historical and current data to describe a random process is known as time series prediction [22]。作为连续观测时间序列数据本质上是不同于其他类型的数据,因为它们并不是独立的,这些观测点的顺序发生时,必须考虑分析时间序列数据。描述、建模、预测和控制是时间序列分析的主要目标。他们是互补的,而不是分离。两个等价表示为时间序列存在。另一种是基于与白噪声时间序列,而首先是基于过去的时间序列值。我们相信,时间序列的白噪声的结果使用线性预测函数来预测其先前的值。时间序列预测的五个品质是科学性、时效性,前提,近似,和描述。其中之一是时间序列预测的科学性,这是基于一个特定的数学模型之间的关系,并基于过去,现在,和未来。时间序列预测的及时性是预计的时间,的描述时间序列预测是预测事情的特点,和时间序列的近似预测是预测的偏差。
3.2。神经网络在时间序列预测中的应用
ANN(人工神经网络)23)具有良好的自学习能力、自适应能力、泛化能力和非线性映射能力。根据神经元的非线性函数,如乙状结肠函数,非线性时间序列可以通过组织重构这些神经元。然而,神经网络也有一些缺点,如长时间的学习,许多结构参数、复杂的拓扑结构,网络的泛化能力差,而且容易陷入局部最小值的训练,等。此外,仍存在一些问题等参数的初始值的选择隐藏层,隐藏的神经元的数量,和学习速率。最流行的神经网络模型是基于摘要的中长期规划。摘要利用是一个多层前馈网络,利用误差反向传播训练。前馈神经网络的神经网络模型,是最常用的。使用摘要利用时间序列预测模型具有简单和高容错计算的好处。然而,它只利用非线性映射。治疗一个动态建模问题作为一个静态建模问题是使用静态前馈神经网络识别动态系统。不能准确反映相关的动力学系统,这将不可避免地导致大量的问题和对模型的性能产生影响。 Many academics have improved the learning algorithm to avoid the BPNN’s inherent flaws. The algorithm is anticipated to benefit from fuzzy logic and ANN. In addition to having strong self-learning and adaptive capabilities, language information can also be used effectively. Furthermore, the network parameters have a distinct physical meaning, which aids in comprehending and analysing the actual system. RBF is a better network in a feedforward network because it is based on RBF. Theoretically, it can approach any nonlinear function that can, in time series prediction, as closely as possible resemble the original time series data. Finding the trained time series data’s best fitting plane in multidimensional time series space is equivalent to learning the original time series data. The structure of NN is shown in Figure1。
一种Elman-NN反馈神经网络的预测模型。输入层、模糊层、模糊推理层和输出层四部分构成一个模糊神经网络。Elman-NN,与摘要和时滞,大小有一个额外的一层一层的神经元接收和反馈函数的输入和输出。接收层是特殊的,因为它有能力存储输出值的隐层单元从之前的运行。这种能力可以用来作为延迟算子给模型作为动态内存的能力,适应不断变化的特点,随着时间的推移,并动态地反映相关的系统特征。Elman-NN可以更好地预测时间序列并执行适应时变特点,因为接收层中的神经元的输出状态可以存储隐藏层,给网络地图动态特性的能力。模糊逻辑结合的简单用户之前与模糊规则系统知识;NN擅长自适应学习网络参数和具有很强的并行处理能力和泛化。模糊时间序列预测模型适合处理时间序列预测问题的不确定性和模糊语言变量,因为它是基于模糊理论和模糊逻辑的概念。模糊时间序列预测模型有效地模型,宇宙必须划分和模糊关系必须处理。 Because of this, many researchers organically combine the idea of “abstract ability” and fuzzy logic’s nonlinear processing capability with NNs’s self-learning capability and ability to approximate any arbitrary function. In this way, the system provides the network weights with a distinct fuzzy logic meaning in addition to performing fuzzy logic reasoning. FNN thus combines the benefits of NN and fuzzy systems. Fuzzy logic and NN’s self-learning capabilities allow it to deal with uncertain information.
3.3。当地建设基于模糊神经网络的金融时间序列的预测模型
线性统计方法预测领域已经受到了很长一段时间。模糊神经网络的本质是赋予传统模型与模糊神经网络输入信息和模糊权重,模糊神经网络的神经元结构模式是与神经网络的学习算法密切相关。具有良好的非线性预测性能和实用性。它是一种变结构系统对环境的适应能力和学习与外界的联系。有许多类型的神经元之间的连接,和神经元之间的连接强度有一定的可塑性,相当于突触传递信息的能力的变化。它可以组织学习和培训,以满足不同的信息处理的要求。模糊神经网络,无论是作为一个近似或记忆模式,需要学习和优化权重系数。学习算法的关键是优化模糊神经网络的权重系数。模糊神经网络分层根据模糊逻辑的步骤,然后神经网络的训练算法是用来调整参数。根据模糊神经网络模型的原理,提出了一种时间序列预测模型在线预测和长期学习的特点。 The prediction model has the characteristics of online prediction and long-term learning and does not need repeated training. The training algorithm flow is shown in Figure2。
在时间序列数据的预测,只有原始的时间序列数据作为网络的输入特征预测,和原始时间序列特性尚未处理,如特征提取和特征选择的原始时间序列数据。系统调整参数并创建培训期间所有规则节点。初始化网络,应该设置的参数初始值,然后,第一个训练样本是用于创建第一个节点,和连接权重 , 设置的公式所示:
其中,是连接从第二层第三层;是连接从第三层,第四层。和模糊输入和输出值的第一个输入样本。在培训期间,和可以表示如下: 在哪里在第三层的节点数;是连接权重矩阵的第二层第三层节点节点 ; 从第三层节点是连接权重矩阵在第四层的所有节点。本文将介绍一个时间强度函数 ,这是定义如下:
其中,是时候强度系数大于0;是最新的数据集的价值;是一个数据集内的随机值;是漂移函数;是波动函数;是一个随机过程。定义如下:
其中,是样品的数量。的定义如下: 在哪里样本的均值。是一个随机过程,满足下列条件:
时间序列中的每个数据点当前预测作出了不同的贡献值;越接近一个数据点是当前的预测价值,贡献越大。因此,每个历史数据集应该给一个角色基于时间发生,这意味着不同的历史数据点应该有不同的权重。以下使用单一预测经常出现的缺点:它是非常具有挑战性的构造一个高精度的预测;一些学习算法或网络并不总是产生最好的预测;没有确定的指导方针,使用神经网络预测时选择初始参数。因为这个原因预测必须集成。综合预测模型充分考虑了各种预测的预测结果同样的问题,这可以提高参数选择和增加预测的准确性和稳定性。本文选择四个评价指标彻底和有条不紊地评估预测模型的预测精度。赛尔不平等系数、梅、RMSE和日军(平均绝对百分误差)是其中(平均绝对误差)。 The calculation formula of each prediction performance evaluation index is as follows:
其中,时间序列的真正价值在时间吗 ; 时间序列的预测价值在时间吗 ; 时间序列的长度。 。当 ,预测值和实际值是完全安装,和模型的预测能力最强;当 ,模型最糟糕的预测能力。
聚合是一些常规的组合节点属于一个“类”成一个普通节点。修剪是节点的删除不再需要在系统完成了一定数量的步骤。根据欧氏距离或模糊距离,这些节点是在相同的“类”在这种情况下,这意味着它们都可以表示为一个节点,在多维空间彼此接近。最后一个特性是选择基于排序的功能。它决定在选择过程中是否每个功能将被添加到功能会影响大于预定阈值的网络错误。如果是这样,它是包含在功能集;否则,它被添加到功能列表。
4所示。结果分析和讨论
时间序列预测的性能评估的一个重要环节在时间序列预测方法的研究和应用。通过评估建立预测模型的性能,我们可以确保其适用性和有效性,验证研究的意义和价值。因此,本章进行实验评估。实验数据都来自风数据库,选择样本数据从1月1日,2012年,2019年12月30日。样本数据分为三个部分:训练集、验证集,训练集和测试集,用于训练神经网络参数,测试集是用来调整神经网络的结构,测试集是用来测试网络模型的预测能力和泛化能力。为了提高预测效果,处理原始数据,见公式(8)。上证综合指数图所示3。
首先,训练集的输入和输出数据集群,然后不同的主要预测模型和二次预测模型建立了每种类型的输入和输出,然后综合模型是建立根据上面的集成方法。测试集的数据,首先判断其类别,然后计算和集成的输出基地根据建立预测模型。具体模型的预测效果如表所示1。
从表可以看出1不平等系数、平均绝对误差率和赛尔网络和摘要小于其他网络预测上证综合指数,在训练集和验证集。这一结果证实了时间序列关系的重要性在时间序列数据的预测。图4显示了该模型的训练趋势。
本文模型的参数选择是隶属函数的数量,隶属函数的类型,和迭代的最大数量,简单,容易操作。通过计算网络的误差指数,它是与其他网络预测的错误。结果如表所示2。
通过这个实验,与其他网络相比,该网络可以提取更多的有用特性的网络预测的替代功能。此外,金融时间序列预测模型提出了更好的性能在时间序列数据的预测。测试的准确性在不同训练集如图设置5。比较不同模型的输出值与实际值如图6。
模糊神经网络模型结合了模糊系统的逻辑推理能力和神经网络的自适应能力,具有良好的非线性预测能力。为了验证其优越的能力,再次进行了实验。图7显示了不同模型的拟合结果飙升的数据。
可以看出,这个网络可以明显提高预测精度。它的性能比的比较方法,但仍有一些无法预测的峰值数据。最主要的原因是,只有原来的使用时间序列数据特性,但有些用户特性,比如用户的性别、城市,消费不习惯。
5。结论
介绍了时间序列和模糊神经网络的发展本文也进行深入研究当地的金融时间序列预测。下一步是提出和建立一个本地基于金融时间序列的模糊神经网络预测模型。当学习网络参数的模糊神经网络,学习速率与初始化后使用比例因子模糊限制玻耳兹曼机参数,从而减少参数随机性的影响。模型的分类精度提高,迭代的数量减少,通过自适应学习速率调整。研究结果表明,该算法能够实现较高的分类精度。本文使用MATLAB进行比较分析来进一步证实了该方法的可行性和可靠性。根据模拟结果预测精度96.31%,9.84%的预测精度比传统的神经网络算法。量的模糊隶属度函数,规则的修剪和聚合,和其他训练参数,所有的网络行为产生重大影响和预测。在这项研究中,FNN-based金融时间序列预测模型的表现如预期和有竞争优势模型。时间序列预测研究的许多问题,目前已经成功地解决了本文完成的。 Although it adds to the body of knowledge in the field of predicting financial time series, there are still a number of limitations that warrant further investigation in subsequent work. Additionally, when applied to forecasting financial time series, the nonlinear method should perform well when mixed with a few conventional models to create a mixed model.
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者没有任何可能的利益冲突。