文摘

时间序列预报系统可以用于投资于一个安全的环境和减少损失的机会。Holt-Winters算法遵循各种程序和观察到多种因素应用于神经网络。最后的模块帮助过滤系统预测的各种因素,并提供一个评级系统。本研究使用实时数据集十五股票作为输入到系统中,基于数据,预测或预测未来属于不同行业的不同公司的股票价格。数据集包括大约15公司不同部门和预测结果的基础上,用户可以决定是否投资于特定的公司;会给一个准确的预测结果为客户的投资。

1。介绍

这项工作的主要目标是帮助一个人投资股票市场通过提供一个预测的各种行业的股票的收盘价。系统接受来自用户的输入他们想投资,投资的持续时间,利润损失或客户是否可以承担多少。系统使用的信息用户和机器学习算法适用于想出一个解决方案,建议用户在哪里投资利润最大化和最小化损失的风险。系统中已经存在的数据库是用于分析市场情况和找到一个最佳的解决方案。投资于股票市场是棘手的工作;因此,这个项目帮助用户在这个过程中,给了他们一个上风。结果尽可能准确。机器学习算法(MLA)在实际工作时间和实时操作数据,提供一个更有效的方式来想出最好的解决方案。机器学习的帮助下,系统认识到以前的模式,并试图显示的输出可能是股票的未来价格。各种算法被用来实现这一目标是Holt-Winters算法(单)1递归神经网络(RNN) [],2,推荐系统(RS) [3)建议最好的股票投资。

1.1。股票的假设

有效市场假说(EMH)是一个理论的基础上制定资金或资本和它州击败市场无法实现,因为股价已经注册总是包括和描述所有的相关信息(4]。根据有效市场假说,交易的股票总是在公允价值证券交易所(5]。因此,它就变得无法实现的投资者购买股票,低于价值或价格卖出股票。这实习生导致购买风险较高的投资,因为它成为不切实际的outshout整体市场通过股票选择由专家给出。相信它是不重要的搜索远低于价值的股票,而不是被低估,预测市场趋势是由通过基本面或技术分析。因此,这一理论已成为争议,被认为是现代金融理论的基石。有效市场假说支持者基于学者指着大实体的证据,但这一理论也有反对者;沃伦•巴菲特(Warren Buffett)是一个很好的例子,他总是打市场多年来,这与理论国家”这是不可能的。“有效市场假说的批评者也一定发生,比如道琼斯工业平均指数)(6),这是一天贬值20%,指着股票价格可以从公允价值耻辱。有效市场假说的支持者认为,投资者必须投资于低成本的股票,因为市场的随意自然。这是支持的2015主动/被动晨星的参数研究,Inc .在这项研究中,一个比较活跃的经理人回报是由相关的指数基金和交换资金。这项研究得出结论,年复一年,两组超过了被动基金50%以上的时间。这两个组织是美国小增长基金和多样化的新兴市场基金。

这对预测结果工作使用三个主要概念。第一个是对股市显示整个季节周期变化,Holt-Winters三重指数平滑法(HWTES)。三个基本都是由该算法考虑:基础水平(提单),趋势水平(TL)和调味料因子(SF)。它们的值计算了我们的实验结果,所有这些因素都使用Holt-Winters分解算法。第二个概念是RNN。RNN的具体模型(7)使用long-short-term内存(LSTM) [8]。这是一样的正常神经网络(某某);唯一的区别在于,每个中间细胞是一个存储单元和零售价值到下反馈回路。第三个概念是推荐系统。它基本上是一个子类的信息过滤系统,旨在预测评级基于不同因素。

2。文献综述

按照我们的文献调查,许多系统可以执行股票市场预测(PSMP)。统计信息是预测的数据集,但研究只是进行深度学习模型(9]。模糊方法是用于短期过程,但这种预测是不适合一个更高层次的股票投资(10]。股票投资建议的想法是一个合适的强烈预测的股份,预兆,但未能测试真实数据集值(11]。文章调查有助于理解之间的各种技术和比较不同模型和具体的功能(12]。一开始的预测技术,使用的ARIMA模型是研究人员和遵循各种分类过程。作者在现有模型无法进行任何更改,这是缺点的解决方案(13]。神经网络适用于股票投资,因为它遵循一定的算法和协议适用于建立一个更好的模式14]。作者提出了优化算法适用于选择一个精确的软件度量模型。这些指标有助于了解客户投资的预测模型(15,16]。慢性元素一直存在在我们的生活中,和长期的数据可以很容易地聚集在各种应用程序(17]。例如,当购买一个在线或点击“添加项目,”项目登记。因此,慢性的调查信息可以应用在各个领域。至关重要的是要注意,用户偏好随时间变化的。例如,一个人看着动画在儿童电视节目将最有可能在成年后切换到看新闻。这是一个伟大的交易将这样的推荐系统的变化。本文介绍了我们的方法,预测用户首选项通过学习的方式购买历史。我们的建议是由三个步骤:首先,获取用户基于矩阵特征分解和购买时间;然后,利用卡尔曼滤波预测用户的偏好向量从用户功能;最后,生成一个列表,此时我们建议两种类型的推荐方法使用一个真实的数据集,我们的方法优于其他竞争方法,比如一阶马尔可夫模型(18]。随着电子商务平台的逐步的价格,用户之间的信任关系已经成为推荐系统的研究热点19]。在本文中,信任关系是熟悉到推荐系统和多源属性信任预言方法基于改进的数据集;证据理论提出了;用户属性是根据每个用户的数据定量调查和选择的四个属性。然后,定量属性是通过减少量化。在最后的属性,证据是重复使用的信任关系力量利用权重分配方法。在建模中,信任预测结果验证了基因折交叉验证方法。此外,该方法与另一种方法。机器学习,结果证明提出的信任的主导价值观的融合方法。

3所示。问题描述

有许多传统的技术用于股市prediction-based新闻系统,但是他们不能预测价格在长期新闻与事件发生在未来是无法预测的。所以,该系统使用递归神经网络预测股票市场价格和Holt-Winters三重指数实现,因此只使用历史数据来预测单个股票的收盘价。系统接受来自用户的输入量多少他们想投资,投资的持续时间,他们能承受多少损失或利润。系统使用的信息用户和机器学习算法适用于想出一个解决方案,建议用户在哪里投资利润最大化和最小化损失的风险。系统中已经存在的数据库是用于分析市场情况,找到一个最优解20.]。投资于股票市场是棘手的工作;这个项目帮助用户在这个过程中,给了他们一个上风。结果尽可能准确。机器学习算法在实时工作,实时操作数据,提供一个更有效的方法来开发最好的解决方案。机器学习的帮助下,系统认识到以前的模式,并试图显示的输出可能是股票的未来价格。

4所示。数据收集和分析

该系统需要的数据集的一个证券交易所的世界;现在,研究人员需要收集数据。有各种各样的数据集可以在股票市场交易网站;这些数据集是在不同的格式,如盘中数据,每日数据,每月每周的数据,或者数据。然而,我们的系统需要手术一般的基础上,而不是主动盘中交易。因此,我们在这里选择去天数据;让我们考虑选择一个特定的证券交易所和选择一个特定的数据格式。

4.1。选择证券交易所

在全世界许多证券交易所市场是可用的,但这是决定选择最大的印度国家证券交易所的证券交易所。现在,分析了无是最大的证交所股票交易员在印度。最大的在线数字交换,给出了选择用户在线购买或出售他们的股票没有任何问题。下了无有一万五千多个证券上市股权部分,使其成为亚洲最大的证券交易所。一旦研究人员选择了股票交易市场,是时候选择特定的股票。

4.2。选择合适的股票

系统需要使用的股票名单,每天交易,在市场上建立了良好声誉。的股票给最好的期刊图关闭股票市场价格和不断地选择交易。我们的系统忽略了盘中交易价格;因此,我们选择的股票给线性曲线。在分析了无分为部门所有股票;每个部门都有成百上千的股票。总共有15个部门;从每个部门选择一只股票。表1显示了一个股票从每个部门选择最佳的系统性能。

4.3。下载文件的数据格式

接收到的数据格式(. csv)文件,也就是说,逗号分隔值后数据集的结构如表2

4.4。ER图的数据集

ER图在图1清楚地表明,它包含三种类型的实体。(我)所有股票实体集中表和记录每一只股票的价值可用于评估。此表包括列如股票id,股票名称,部门的特定的股票,目前的市盈率E比那个特定的股票,股息收益率,RMSE值的预测。(2)有15个股票实体表与所有股票表;每个股票表命名实体的象征。这个表记录每日数据的每一只股票交易在过去的三年里,每天的一行。它包括像股票id列,象征,日期,之前关闭,打开,高,低,接近,最后,平均和交易数量、移交,交付数量和交易的数量。(3)客户表记录每一位客户的登录id;这个表是新客户登记的时候更新。它存储数据的名字、电子邮件和密码。

4.5。每个属性的简短描述

(我)所有股票(实体)(2)股票ID: ID分配给每个股票(主键)(3)名称:股票的名称(iv)股票所属部门:部门(v)市盈率,每股价格除以每股收益(vi)股息收益率:津贴由证券股东每股百分比(七)RMSE:均方根误差的测试数据的每个股票(八)股票(实体)(第九)StockId: ID分配给每个股票(主键)(x)象征:股票的象征(十一)日期:日期的行表示的数据(十二)之前关闭:前一天的收盘价(十三)开放:开盘价的那一天(十四)高:高价值记录(十五)低:交易记录最低的股票(十六)最后:去年证券交易的价格(十七)关闭:关闭股票价格的那一天(十八)平均:股票的平均价格(十九)交易数量:那天的贸易总额(xx)翻:一天的营业额和公司(第二十一章)交付数量:数量的股票,需要在两天内交付给新股东(二十二)交易数量:数量的股票交易

4.6。MySQL表的描述

数据2- - - - - -4显示正在使用的MySQL表描述来实现这项工作。

5。基本结构和实现

使用的编程语言Java项目开发。Java是一种通用的面向对象的编程语言。然而,使用机器学习在Java不是一项容易的任务,因为没有合适的预定义的功能。股票市场预测系统使用三种不同的算法:Holt-Winters三指数算法,递归神经网络,推荐系统。在这个研究中,NetBeans 8.1是一个Java集成开发环境(IDE)为Java项目的发展。这个项目是一个独立的Java应用程序;也就是说,它是一个独立的平台,就需要MySQL和最新的java开发工具包(JDK)运行的项目。这个项目提供了一个JAR文件,可以转移到任何平台运行所需的代码和使用许多图书馆进行深度学习和用户界面的开发。所有使用的库是开源的,注册一个开源许可下。这个项目的实施可以很容易地分为三个部分。 These three sections are different concepts and use different algorithms:(我)Holt-Winters三重指数算法:该算法用于给一个时间序列的预测股票的收盘价;它使用三个因素,我们将在后面详细讨论(2)递归神经网络:长短期记忆RNN的深度学习算法,并使用它们来预测股票(3)推荐系统:该算法给出了最好的方式向用户推荐特定股票通过给每个股票评级基于不同因素

5.1。项目的基本结构

5显示已经创建了项目计划,为了实现这项工作。

5.2。系统实现

这个项目主要适用于三个主要概念,为系统提供三年的数据十五股票和想预测明年的下个季度。因此,我们设想在750行历史数据的安全,我们希望预测未来59天的收盘价。

5.2.1。HWTES算法

Holt-Winters三指数算法当数据表现出趋势或合理性。它捕获的需求和趋势加班。我们观察需求分解成三个不同的组成部分:(我)基础水平(2)趋势水平(3)季节性因素

当预测开发,它将重组的需求期望通过总结所有三个元素。它与趋势和季节性指数平滑法,因为类似于简单的指数平滑法,应用平滑因子。不同之处在于,它将观测需求分解成三个部分,然后平滑常数适用于每个其中之一;观察三个平滑因素的原因,也就是说,α,β,γ。开头第一段的数据和实际需求的观察和减去平均需求的观察3年的课程。这项研究花了两周的数据,然后拖累相同的公式从剩下的几周。将所有总结0作为平均需求减去实际需求。它开始从52到最后的基础水平和减去及时从实际需求因素。

该方法的基本方程给出如下。

总体平滑:

趋势平滑:

季节性平滑:

预测: 在哪里y是观察,年代是平滑的观察,b是这一趋势的因素,我是季节性指数,F是天气预报时间提前,t是一个指数表示时间

对于给定的基础水平,(我)α= 0.200(2)β= 0.300(3)γ= 0.200

这三个因素的结合提供了最好的收益率本周53实际需求-本周的季节性因素。估计POS分解成三个不同的组件。有两种不同的方法评估每个组件和权衡他们运用各自的权重因素。简单地复制下来在剩下的星期5年的3,那么第6周的周预测每年的3至52年3周的最后一天。最近的季节性因素是第二年的第6周;然后,我们可以拖累。

5.2.2。分离培养和测试数据

在本文的研究中,训练数据和测试数据需要分离。从我们的算法,实现一个错误比开发人员首先准备模型,然后运行测试数据的算法。开发人员收到RMSE,我们的错误参数。训练数据来自01/01/2017 30/09/2019,计算总行到743行。测试数据来自01/10/2019 31/12/2020,总行到59行计数。预测数据来自01/01/2021 31/03/2021,计算总行58行。

5.2.3。LSTM递归神经网络

LSTM是一个递归神经网络进化,俗称RNN。正常RNN模块把最后一层的输出通过一个双曲正切函数。盖茨LSTM使用一个反馈回路和记住。它有四个RNNs层每个模块进行交互。LSTMs背后的核心理念是“模块状态ββ”是主链的数据流。在神经状态,它允许数据流几乎不变,尽管一些线性变换。然而,从“LSTM可以添加/删除数据β“通过s形的“盖茨”,尽管LSTM模块不同的实现。在LSTM,如果输出输出反复甚至乘以1,然后输出迅速变小,这降低了学习速率。LSTM表现不同;它有4个功能。该模块允许LSTM模块循环LSTM内存状态。盖茨把输入的输入,然后决定多少应该用于更新模块状态。例如,乙状结肠决定应该使用多少输入更新。例如,对于“0”,它不更新任何事情,但对于“1”它更新整个模块状态或者介于两者之间的任何东西。他们允许保持长期记忆的神经元发生了什么。

例1。时间序列方法:这种方法有以下步骤:(1)罪波预测(2)负载500 1时期(3)分成的窗户长度50(4)分裂成火车/测试集(90/10)(5)重塑NumPy数组3-dimentional数组:总窗口,窗口大小,1 [[[x]、[x1]、[x2]],[[x]、[x1]、[x2][x3]],…。)这种方法的步骤如下:(1)创建LSTM模型:(我)(50100 1)(2)50和100年LSTM神经元(3)1完全连接输出(线性激活)(2)培养模式:(我)只需要1时代(3)测试下500步预测:(我)初始化与1序列的测试数据(2)奇异的下一步预测前馈序列窗口(3)序列窗口转移到删除0th元素,推动预测值为n个元素(iv)> 50步后窗口将只在预测预测

5.2.4。修改的推荐系统

一个子类的信息过滤系统旨在为用户预测可用的最好的股票。一个正常的推荐系统会接受布尔值,例如,一个商品被喜欢或不喜欢。然而,在这里,使用一个加权的推荐系统,这将接受股票市场的各种因素作为其参数来比较不同的股票价格。让我们首先讨论这些因素:(我)RMSE:这项研究获得了RMSE值当我们预测数据使用RNN算法或Holt-Winters三指数算法。这个因素表明多少我们的预测精度。如果我们得到更高的权值,那么评级较低的股票,如果我们让RMSE值越低,意味着我们的预测是好的,我们可以信任我们阅读,我们给一个更高的股票评级。(2)DY:股息收益率是一个比例值,保持共同为特定股票。实际上,股市证券给股东的股息收益率任何商品。这是促使曾经每个月或季度为长期投资者持有股票;同时,这个红利值变化直接与安全的利润成正比。因此,股息收益率,股票就越好,反之亦然。(3)市盈率:市盈率代表市盈率。这是每股价格在每股收益的比率。基本上,它给股票的状态。市盈率是比评估措施的公司当前的股价每股收益。市盈率有时也被称为价格或市盈率倍数。这使得股票的评价;更大的市盈率意味着股票价格被高估了,随时会下降;因此,我们将给一个较低的评级,反之亦然。(iv)ROI:这代表投资回报率计算如下: (v)这是一个比例数量:投资回报率越高,更好的评级我们给我们的股票。

例2。推荐最好的股票(表3)
给每个用户评级后,我们将显示所有可用的期权购买股票列表中按等级排序的推荐系统。

6。用户界面模块

这个推荐系统的接口模块的快照可以如图6- - - - - -12

7所示。结论

股票市场预测工具执行并显示所需的实时数据集的结果。选择的示例数据库系统工作得很好并正确地代表所有部门的行为。此外,像Holt-Winters算法和递归神经网络预测算法LSTM四分之一的收盘价的预测从01年到08 - 2021 - 30-11-2021,平均RMSE值小于50在许多情况下。推荐系统也正常工作,表现最好的股票购买在一个给定的时间间隔。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。