混合LSTM-Based集成学习方法对中国沿海大部分煤炭运价指数的预测

文摘

中国沿海大部分煤炭运价指数(CBCFI)反映出在中国沿海煤炭运输市场运价的波动,显著影响企业的战略决策和风险规避。尽管趋势分析运价已经广泛开展,航运市场的财产,即。,它会随着时间的变化和不稳定,导致CBCFI很难被准确地预测。研制了一种新颖的混合方法,整合长短期记忆(LSTM)和预测CBCFI集成学习技术。混合LSTM-based合奏学习(LSTM-EL)方法预测CBCFI提取时间信息的原始数据和合并CBCFI-related数据,例如,国内外动力煤现货价格,煤炭库存,燃油价格和原油。证明该方法的适用性和通用性,不同时间尺度数据集(如每日、每周、每月)在一个滚动预测实验进行。实证结果表明,国内外动力煤现货价格和原油价格有很大的影响日报,每周、每月CBCFI值。在每日、每周和每月的预测情况下,LSMT-EL方法有较高的预测精度和更大的趋势服从比相关的单一的集成学习算法。混合方法优于其他处理信息时涉及一个戏剧性的市场衰退,阐明CBCFI的预测能力。目前的工作是高意义一般商业、商务有关,在沿海航运市场和对冲战略过程。

1。介绍

如今,全球90%的交易是通过海上运输完成(1]。海洋运输是至关重要的业务系统的全球和国内贸易系统。中国沿海大部分煤炭运价指数(CBCFI) [2)建立及时的反映在中国沿海煤炭运输市场运价的波动,通过遵守目前的机制,中国沿海散货运价指数(CBFI) [3]。这个系统可以宣传方面的复杂和现货率索引有关的各种路线/类型船只的沿海煤炭日常服务市场。中国沿海散货运价指数专家提供CBCFI货运数据每工作日(上海航运交易所宣传CBCFI官方网站以及http://www.chineseshipping.com.cn下午(北京时间)在每个索引出版)。

CBCFI代表了航次租船运费率条件有关散装煤炭航运市场的沿海地区。这表明不稳定的产权属于煤炭散货航运市场,以及反映了发展中国家与中国经济状况和国内业务趋势。因此,它指的是“晴雨表”属于散装煤炭航运市场的沿海地区。由于提到的功能,大量的内部人员和专家尝试估计随后倾向与市场大部分沿海地区煤炭运输的准确预测大部分煤炭运价指数指导公司战略决策。此外,预测CBCFI价值使操作人员和决策人员管理市场趋势和避免风险在沿海煤炭运输市场。此外,它有助于产业和我司与国内运输系统。

先前的研究表明,航运运价指数通常呈现复杂的不稳定特性不确定,周期性和非线性属性(4- - - - - -6]。达到满意的运价指数的预测,各种货运指数预测方法开发以前,在计量经济学时间序列预测方法表现出的非平稳、非线性信号的缺点,而单一的神经网络(NN)方法展示缺点过度拟合,局部最小值点,参数选择问题。因为单一的计量经济学和运价指数预测的神经网络方法是有限的,最近,实证研究不断演示混合动力技术的适应性。混合方法能够结合个人的方法,使各自的优势弥补别人的不足。

最近,集成学习算法被广泛用于分析多变量预测。集成学习算法(例如,随机森林(RF)和梯度提高回归树(GBRT))是有效的在决定的基本变量时间序列和研究变量之间的内在关系7]。在过去的几年中,集成学习算法被广泛用于研究提到股票价格时间序列,波罗的海干散货运价指数,和交通流,导致生产必不可少的结果(8- - - - - -10]。

集成学习算法的快速发展提出了一个新颖的想法的方式利用multidata从原始数据和提高了可读性。我们这里将人工智能和集成学习算法制定一个新兴混合的方式,一个学习(LSTM-EL)方法(例如,LSTM-GBRT和LSTM-RF)利用长期短期记忆(LSTM) CBCFI预测。LSTM层内的方法,获得细节依赖于时间内的数据,和GBRT /射频层显示整体的鲁棒性学习的训练方法。

目前有以下组织工作。部分2介绍了审查的运费市场的分析。部分3介绍了设计方法。部分4介绍了数据收集。节5,性能接收比较和分析的方法。最后,部分6给出了结论。

2。文献综述

因为运费是不确定、不稳定、定量方法分析利率引起长航运行业的关注。因此,增加文献提出的方法预测运费,其中许多使用波罗的海干散货运价指数(BDI) [11]。BDI和CBCFI航运指数,有效地评估当前形势或航运市场,和他们有一些相似的特性。首先,CBCFI和BDI都是每日发放了领先指标,衡量运输原材料的成本。具体来说,BDI主要措施对干散货大宗商品运输成本,包括煤、谷物、铁矿石、和金属,而CBCFI主要措施的煤炭运输成本;第二,在构成方面,BDI需要23航道测量时间宪章和航行的基础上而CBCFI需要14航道测量航行的基础上;第三,至于船的类型,BDI的船只可以携带15000载重吨货物(DWT) -80000 DWT(全球舰队的90%),而CBCFI关注的船只可以携带15000 DWT - 60000 DWT (3,12,13]。BDI和CBCFI分享这些类似的特性,我们把丰富的BDI获得一个明确的观点的研究目前的预测方法。BDI等的分析方法分为三种类型。

最初覆盖传统的计量经济学方法,包括向量误差修正(VEC)、广义自回归条件异方差性(GARCH),向量自回归(VAR),和自回归综合移动平均(ARIMA)方法。Cullinane et al。14)首先开发了一个波罗的海干散货指数(BDI)研究方法方法通过ARIMA方法。Kavussanos和Alizadeh-M15)开发一个season-related ARIMA方法一个独立变量以及一个VAR方法研究干散货航运市场的季节性。巴舍乐等。16]讨论了VAR的表演和ARIMA以及矢量平衡校正(结果)的预测方法发现和远期运费。为了提高BDI预报的准确性,Tsioumas et al。17)开发了一种多变量向量自回归方法与外生变量(VARX)方法,结果表明,VARX方法优于ARIMA方法。陈等人。18)应用ARIMA和VAR方法预测几个干散货的现货价格的路线和发现的VAR方法表现好于ARIMA方法测试样本的预测。不言自明的et al。19]显示cointegration-based方法分析区域海洋运费的动态属性。

根据Stopford [20.)、海洋预测是困难的对传统统计学和计量经济学的方法捕获的非线性干散货运费(21]。因此,第二种分析方法目前雇佣了几个非线性和人工智能(AI)的方法,包括人工神经网络(ANN),机器学习算法和非线性方法。李和帕森斯(22)神经系统应用于预测每月油轮运费从短期到长期,发现神经系统优于ARIMA时间序列方法预测从长远来看。杨et al。23调查和预测相关运价不稳定性令人担忧中国沿海散货运价指数(CCBFI),中国集装箱运价指数(目前),和波罗的海运价指数(BFI)利用支持向量机(SVM)。Thalassinos et al。24)采用了一种混乱的方式来预测使用不变的BDI系数有关的奇怪吸引子在重建、管理系统的发展过程。关等。25)开发了一个基于多步预测的方法来预测每周波罗的海超最大值指数(BSI)数据。Şahin et al。26)开发三种ANN方法基于BDI数据和结果表明,他们的表演结束,而最高的一致性与安利用过去两周观察BDI的数据。深度学习的方法,长期短期记忆(LSTM)神经网络被认为是一个实用的技术来处理时间序列问题[27- - - - - -29日]。例如,纳尔逊et al。27)采用LSMT网络预测股票价格的未来趋势根据历史价格,与技术分析指标;段et al。30.]的LSTM模型实现多步向前旅行时间预测。上述研究表明,神经网络方法生成更有效的预测性能比传统的时间序列和计量经济学方法。

尽管NNs能够处理非线性和显示更好的鲁棒性,很难确定神经网络算法的配置;此外,它会落入或缺乏训练,容易导致局部最小值捕获(11]。这提示转向第三类混合方法,通常集成了一个减噪方法采用一个NN-based算法。列昂诺夫和Nikolov31日)提出了一种小波和神经网络的混合方法研究波动波罗的海运费的巴拿马型路线2和3。Bulut et al。32)建立了一个向量自回归模糊逻辑预测方法相结合的定期租船费率。曾庆红et al。(33提出一个混合方法的经验模式分解(EMD)以及安过程。Uyar et al。34)提出了一个反复训练模糊神经系统使用遗传算法对提高长期干货运费预测更准确。作为一个有效的策略来提高单个模型的预测能力,整体学习模型被广泛用于提高性能(35- - - - - -38]。例如,Kamal et al。35)开发了一种深合奏反复复发性神经网络(RNN)的网络,long-short-term内存(LSTM)和封闭的整流单元神经网络(格勒乌)改善BDI预测性能,结果表明,整体方法优于单一深度学习的方法。谭et al。37)提出了一个LSTM-based深合奏装袋相结合的学习模式,随机子空间和提高预测ultra-short-term工业电力需求,他们发现该模型比LSTM获得较高的精度和鲁棒性,极端的梯度增加(XGBoost),其他时间序列的方法。刘等人。36)提出了一个深刻的空气污染预测模型基于wind-sensitive PM2.5浓度注意力机制,LSTM, XGBoost,和实验说明该方法优于单一的多层感知器(MLP),支持向量机,LSTM, XGBoost。上述研究表明,结合机器学习和神经网络模型通常获得更好的比任何单一模型预测的结果。

虽然许多研究已经进行了解决航运指数预测问题,大多数没有考虑不同利率或其他相关因素信息。因此,这些方法不能有效反映有助于加强预测性能的关键因素。为了解决这个问题,我们提出一种混合模型LSTM和整体学习算法来处理CBCFI预测问题。LSTM方法有能力获得的数据都是由时间和显著影响时间序列的预测过程,而这种方法未能适当地我的外生变量在预测转折点之间的隐含关系数据。因此,为了更好地利用特征信息,有必要把一个适用的集成学习算法优化特征组合来构造特性集,反映了CBCFI的短期/长期趋势。整体学习的一部分,增加和装袋是两个重要的观点;他们都把一组弱学习者创建一个强大的学习者,获得更好的性能。在各种各样的机器学习方法,梯度提高回归树(GBRT) [39)和随机森林(RF) (40)收到关注,通常用作集成学习算法的代表。GBRT和射频decision-tree-based合奏使用增加和装袋框架的学习算法,分别。由于梯度增强算法的实现或引导抽样法,GBRT或射频可以处理变量快速,适合复杂的任务。因此,本研究采用CBCFI GBRT和射频集成学习算法的预测。

3所示。数据描述

本部分首先介绍了数据源。这个数据集包括历史运价指数和其他影响变量,变量的相关性以及在本节进行介绍了。

3.1。数据源

本研究中所有的数据集是由风经济数据库41]。风对130万多名macroeconomy-related和行业基于有效的图形和数据的时间序列研究设备,阐明中国经济金融相关专业人员。

中国(沿海)散装煤炭运价指数(CBCFI)是一种复合工作日指数(零假期和周末),认为14航线(2]。需要2011年9月1日为基期,和基本指数1000点。现在,CBCFI广泛受雇于工业从业者和被认为是一个重要的经济指标在沿海煤炭运输。图1显示CBCFI的合成路线及其对应的权重。可以看出CBCFI主要描述了运输的航运市场煤从北到南。根据直方图图的底部1,我们注意到六路线的权重超过10%保持统治地位,而他们大部分离开秦皇岛港口。很容易阅读,在图1占主导地位的红色路线,对于那些体重不到10%,但非零值,在深灰色路线标记,而在浅灰色的权重为零。

先前的研究传统的航运指数(例如,BDI)一般讨论每日,每周,每月预测情况下评估方法的性能在短期,中期,长期预测(11,16,22]。因此,在这篇文章中,每日、每周和每月的预测实验,进行完整的可用CBCFI数据从2012年1月至2020年10月受聘为实验数据,与2129年每日观察,422周的观察,观察10年度。

根据图2,CBCFI波动表现出不规则的属性和高频率以及振幅。从长远来看,从2012年到2016年上半年,CBCFI有一些拐点。在2013年第四季度,CBCFI达到1450.39发布以来的最高值,然后返回到低水平在今年年底。从2016年下半年到现在,CBCFI经历了很大的波动范围,尤其是从2017年到2020年。与前几年相比,上升和下降的运费已经大得多,和兴衰的频率也会增加很明显,它反映了多变的沿海煤炭运输市场情况。此外,2019年全球冠状病毒病(COVID-19)爆发产生的公共卫生危机,2019年12月开始,这对航运业的经济有一定的影响。季节性波动,从每年的趋势,除了2014年,CBCFI显示了指数上升的现象在其他年份夏季和冬季,但每年增加率是不同的。主要原因是夏季和冬季的煤炭需求会上升,传统用电的高峰季节,导致煤炭运输价格季节性上涨。虽然不是每个夏天还是冬天都过去7年,增加利率,利率上升的历史统计数据表明高概率在每年夏季和冬季。

证明的不确定和非线性特征CBCFI系列、描述性统计的每日提供CBCFI及其变化率,和结果列在表1。CBCFI的变化率。


统计	每日CBCFI	CBCFI变化率

的意思是	722.6500	−0.0002
中位数	675.4800	−0.0012
标准偏差	223.8494	0.0228
最大	1706年.2000	0.1186
最小值	370.9900	−0.1337
峰度	1.7801	5.6084
偏态	1.2186	0.2550
jb	658.9484	626.4104
价值	0.000	0.000
ADF(滞后)	−4.5298 [12]	−11.3960 [12]
价值	0.0130	0.0164
问(滞后)	26.571 [6]	15.95 [6]
价值	0.000	0.000
观察	2129年	2128年

请注意。jb,代表了Jarque-Bera (jb)进行拟合优度检验的测试为研究时间序列是否遵循正态分布(42]。ADF代表增强Dickey-Fuller (ADF)测试的零假设的存在自相关样本系列(43]。代表了Ljung-Box残差平方(也称为统计问统计数据的平方剩余工资)非线性测试(44]在虚假设条件下正确指定的线性模型的线性和残差应该是独立的(45]。

从上面的统计数据,它可以观察到,偏斜度和峰度、偏态的CBCFI系列及其变化率大于零,和峰度的要么是小于或大于3。因此,每日CBCFI及其变化率系列没有右偏态,分别,这表明他们有顶点和厚尾特征。此外,jb,测试结果表明,这两个时间序列不遵循正态分布,因为他们拒绝的假设Jarque-Bera (jb)统计在5%的显著水平。此外,每日CBCFI及其变化率系列表示非平稳的,基于增强的结果Dickey-Fuller (ADF)单位根测试;具体来说,t总结在表统计值1不到批评的价值(−2.86))。此外,Ljung-Box残差平方(也称为统计问统计数据的残差平方)应用于测试的非线性CBCFI及其变化率系列。在落后6为两个系列,我们拒绝不相关的假设在5%的显著性水平。Autocorrelated残差平方非线性的迹象(2]。上述统计数据表明CBCFI有不确定,不稳定,复杂和非线性特性,这些特性证明提出的整体方法的必要性。

3.2。CBCFI影响因子数据

在其他市场,运费在航运业得到基于互动形成过程有关的各种因素,如运输货物的价格、供给和需求和成本。因此,如果这些元素影响CBCFI,那么他们应该调查。沿海运输的需求来自出口商和进口商的需要运输煤炭特别是国内目的地。“派生”需求主要是受到国内经济和贸易的影响,如进出口贸易(专业),工业生产,国内煤炭库存,合同利率,和国内动力煤现货价格。随着国内经济改善,会促进国内贸易和航运运输将会有更多的要求。此外,随机冲击基于紧急事件(例如,2015年天津爆炸和2019年COVID-19爆发)和周期性和季节性煤炭海运市场走势进一步证实,航运交通的需求取决于宏观经济因素。此外,交通消费和成本构成其他CBCFI番茄。收集数据的承诺,CBCFI被认为是最大的相关数据,可以大致分为三类:(我)国内和海外的动力煤现货价格。值得一提的是,秦皇岛港口是全球最大的煤炭出口的港口,和CBCFI的路线是电煤运输的主导运营商从北到南。因此,热煤的现货价格被认为是影响CBCFI波动的关键因素之一。此外,市场的扩大开放,国际市场对国内市场的影响将日益加剧,以及国内外市场之间的相关性将进一步增强。即使在这个阶段,电煤的价格在国际市场上影响出口煤炭,这将反映在电煤的价格。(2)煤炭库存。煤炭库存是指影响煤炭价格的一个关键要素的基础上,经济新常态46]。煤炭库存是煤炭生产的结果、运输、消费、和其他因素。它基本上是一样的价格形成的因素,并主要对电煤的价格变化的影响。近年来,秦皇岛煤炭库存已成为动力煤价格变化的风向标47]。(3)燃料油和原油价格。一方面,燃油价格产生重大影响煤炭价格随着燃油价格影响航运的成本。燃油的价格上涨时,运输成本将会增加;燃油的价格下降时,运输成本将减少。另一方面,煤炭和原油是最基本的能源,和石油价格的急剧上升也导致动力煤价格的上涨(48]。原油价格的影响在热煤价格反映在以下几方面。首先,原油,即一种至关重要的化石能源,是指煤炭占主导地位的替代。因此,原油价格不稳定会影响煤炭需求和价格以相应的方式(49]。当原油价格上涨,对煤炭的需求将上升的替代品。煤炭价格的波动会影响大部分煤炭运输成本,从而影响CBCFI值。请注意,本研究讨论的“价格”包含现货价格和期货价格(现货价格是一个提供立即完成商品交易,而未来远期交货合同锁在一个价格)。表2总结了上述因素在基本特性集和以后再进行优化。变量的特性描述顺序编号。


变量的类别	变量描述	特征数	皮尔森系数值

国内和海外的动力煤现货价格	秦皇岛Port-Q5500 Index-FOB(现货价格是一个提供立即完成商品交易,而期货合约锁在一个为未来的交货价格。它让它的起始点)		0.550
	秦皇岛Port-Q5000 Index-FOB		0.575
	秦皇岛Port-Q5500K Index-FOB		0.512
	秦皇岛Port-Q5000K Index-FOB		0.530
	金汤Port-Q5500 Index-FOB		0.554
	金汤Port-Q5000 Index-FOB		0.571
	广州Port-Q5500指数(澳大利亚煤炭)EXT (EX-tank (EXT)是指从仓库运送煤炭的价格,包括煤前的价格是放入仓库和仓库使用费用)		0.545
	广州Port-Q5500指数(印度煤炭)ext		0.571

煤炭库存	秦皇岛港口		0.007
	曹妃甸港口		−0.157
	广州港		−0.021
	天津港		−0.295
	金塘港		−0.197

燃油价格	180年燃油Singapore-FOB		0.202
	380年燃油Singapore-FOB		0.205
	中国燃料油期货收盘价(收盘价的最终价格在正常市场交易小时每天)(连续合同(连续合约再保险合同,没有一个固定的合同结束日期,这将继续更新,实际上直到一方在合同终止。连续合同不同于标准的再保险合同,他们不提供保险只有一个固定的一段时间)		0.265
	中国燃料油期货收盘价(活跃的合同(一个活跃的合同意味着未来合同可以为一个特定的交易时间))		0.272
	中国燃料油期货结算价格(结算价格是合同交易的平均价格,计算在每个交易日的打开和关闭)(连续合同)		0.266
	中国燃料油期货结算价格(活跃的合同)		0.273

原油价格	布伦特原油现货价格		0.152
	西德克萨斯中质原油(WTI)原油现货价格		0.157
	迪拜原油现货价格		0.152
	WTI原油期货结算价		0.181
	布兰特原油期货结算价		0.187

3.3。变量相关分析

给一个清晰的和简单的视图CBCFI和相关影响因素之间的相关性,皮尔逊相关系数(50计算和结果展示在表2。国内外动力煤现货率(∼)与CBCFI显示明显的相关性,特别是“秦皇岛Port-Q5000 Index-FOB,”“金汤Port-Q5000 Index-FOB,”和“广州Port-Q5500指数(印度煤炭)ext "最大的皮尔森相关值;另一方面,煤炭库存( )显示负相关性CBCFI系列。根据结果,我们删除两个变量的皮尔森系数最小值(和 ),选择和剩下的22个变量作为输入变量。

此外,展示整体学习所需的属性选择算法处理CBCFI预测问题,24个变量之间的关系和CBCFI检查。然后,生成一个彩色皮尔森相关矩阵。数值有深蓝色的表达表明一个总体积极的两个特征的线性相关性,而黄绿色表明零,证明没有线性相关性。作为显示在图3,有24个变量之间的相互关系的不同程度。例如,燃料油现货和期货价格( )与原油现货和期货价格高度相关( )。因此,整体学习算法处理multidata关系被认为是解决CBCFI预测问题。

4所示。方法

在本节中,我们首先给出一个问题的陈述提出预测问题研究的概述在这工作。然后,核心概念和流程提出了混合模型结构的算法伪代码。最后,预测精度测量。

4.1。问题陈述

这项工作的目标是预测第二天的CBCFI值给定的历史数据。我们定义的历史观察CBCFI作为目标 ,在哪里T代表时间窗口大小CBCFI值在时间吗t。同样,由辅助因素 ,在哪里指定数量的相关因素。所有的值吗相关因素在时间t, 的价值吗因素在时间窗口T。因此,预测目标可以定义如下: 在哪里是我们的目标是学习的映射函数。

4.2。准备数据

CBCFI时间序列长度为 , ,时间序列首先应该预处理。数据清洗和数据标准化是关键数据准备任务进一步预测任务。给定的时间序列没有缺失值和保留真实数据的特点,没有进行降噪或数据平滑数据。在这项研究中,我们只与min-max规范化数据归一化算法。时间序列规范化和由此产生的正常数据表示为 : 在哪里的最小值和的最大价值。

4.3。LSTM-Ensemble学习(LSTM-EL)方法CBCFI预测

传统的货运指数预测方法通常使用的历史时间序列数据的目标与无知其他影响因素。一般来说,CBCFI的趋势反映在两个方面:历史CBCFI信息和影响因子信息。历史时间序列信息有时是稀疏,因此不足以产生准确的预测,尽管一些密切影响因子信息可以从不同方面反映CBCFI的运动在某种程度上和支持风能经济强大的数据库的数据库(风经济数据库,请参考https://www.wind.com.cn/en/edb.html)。

我们建议LSTM-EL模型由两层组成:第一层,一群LSTMs构造生成嵌入特性,在第二层,最终CBCFI预测的整体学习法。

图4说明了总体框架的上下两层的混合LSTM-EL配置;它由一个LSTM方法和两种并行集成学习的方法。注意,LSTM-EL模型包括两个不同的混合模型,LSTM-GBRT LSTM-RF。GBRT表现类似于射频的方式拟合多树,但它不是适合他们的顺序,因此本文旨在探索的另一个期望的整体算法适合CBCFI更好的预测问题。详细描述的单一射频、GBRT LSTM方法,见附件。

在第一层,第一数据集分成样本内和样本外的。初步嵌入式LSTM集中在提取样本的时间依赖性信息变量并生成从去年LSTM层嵌入特性,GBRT /射频是作为一个学习方法做出最终的预测结合初步从LSTM嵌入特性,和每个树的预测价值总结得到最终的价值。提议的细节LSTM-EL算法模型进行了说明1。

	输入:历史的观察: , , , , , , ;输入序列的长度(时间间隔): ;功能尺寸:(即。,22我nth我s paper).
	输出:学会LSTM-EL模型。
	/ /构造训练实例
	所有可用的时间间隔做:
	, / /嵌入部分——LSTM模型提取信息随时间变化的特性。
	给定一个训练实例 :
	步骤1。嵌入特性:
	/ /由LSTM嵌入特性,融合时间和内部的相关性到一个新的向量较低的维度,(等于单位的数量在过去LSTM层和致密层只有一个单元)。然后被用来预测在第二层。
	步骤2。LSTM预测:
	/ /由LSTM部分给出的预测价值。注意,我们使用优化的参数嵌入部分,最后我们的预测方法是通过下游方法,GBRT和射频。
	步骤3。优化:
	/ /嵌入的是训练有素的上面通过最小化目标函数及其参数通过反向传播更新。/ / GBRT或射频作为下游做出最终的预测方法。
	/ /模型1:GBRT部分
	考虑到嵌入特性生成的 :
	输入:训练集 ,可微的损失函数 ,和树的最大数量。/ /是决策树映射函数,最优可以通过减少损失函数。
	为米= 1,米,做
	为t= 1,N,做
	。/ /步长,是基础的学习者,是学习速率。对于每一个步骤,一个新的决策树的目的是纠正错误由学习者先前基地。
	输出模型/ /
	/ /模型2:射频部分
	步骤4:考虑到嵌入特性生成的
	输入:训练集 ,森林树木的数量米
	为米= 1,米,做
	/ /D是一个训练集
	=用随机特征选择决策树( )/ /表示属性的数量在每个节点使用,随机选择统一为每个新特性
	修剪树out-of-bag误差降到最低
	平均所有米树
	输出模型。

GBRT背后的想法是,每个迭代器是用来减少前面的残余。为了减少这些残差,新树损失函数的梯度下降方向。LSTM形成训练样本后,递归形式回归树的方程来计算在算法1。

在构建二层LSTM-EL之前预测的架构,几个hyperparameters应该确定。上游模型LSTM, LSTM网络优化的多个hyperparameters取得了可接受的性能时应用于序列数据(51]。对于时间序列问题,关键hyperparameters包括LSTM层的数量,在每个节点的数目LSTM层,完全连接层的数量,和相对较晚,对集成学习算法,许多树和树的最大深度是最基本的参数。在我们的工作中,时间间隔和嵌入hyperparameters大小是最重要。(1)时间间隔:时间间隔参数时间序列预测的性能产生重大影响(52),因为它决定了历史序列的长度,应包括培训。(2)嵌入大小:也就是说,最后一层的神经元数LSTM网络代表下游整体学习模型的输入数据维度,进一步确定GBRT和射频的复杂性。如果嵌入大小是非常高的,那么LSTM会过度拟合训练实例,增加下游模型的训练困难,如果规模太小,那么它将无法记住时间依赖性信息收集的时间间隔序列。

然而,我们所知,没有一般规则选择时间间隔和隐藏层的大小。因此,我们研究了关键参数的影响,同时保持其他参数固定不变,和网格搜索(53)是应用于找到最优hyperparameters。要做到这一点,我们的模型需要一些基本的设置。在我们的工作中,我们构建了我们的模型使用两个LSTM层和一层完全连接。第一层神经元的数目等于第二层。的搜索空间上面的四个重要参数见表3。


Hyperparameters	搜索范围

时间间隔	(2、4、6、8、10]
嵌入的大小	(16、32、64、128)
数量的树	[1000]
树的深度	(1、50)

对于每个时间间隔和嵌入大小的组合,LSTM-EL模型设计和训练,和相应的最优组合的数量选择树和树的深度利用网格搜索。在这里,为了简便起见,时间间隔的不同组合和嵌入的大小评估的均方根误差(RMSE)和平均绝对百分比误差(日军)和结果如图5和6。根据先前的研究,李et al。54)表明,一个小的时间间隔不能保证足够的长期记忆输入LSTM-EL模型;因此,长期记忆的模型不能充分利用LSTM建模。大晚允许无关的输入的数量增加,从而增加模型的复杂性和学习有用的特性的困难。它可以观察到的影响在每个神经元层节点的数目显示,神经元节点的数量的增加,预测性能略有提高。因此,我们设置不同的时间间隔大小和嵌入在连续实验中优化精度和时间效率LSTM-GBRT和LSTM-RF表示的RMSE和日军。根据实验的结果,表4总结了获取模型的最佳参数。

(一)

(b)

(c)

(一)

(b)

(c)


算法	最好的配置	预测的情况下
算法	最好的配置	每天	每周	每月

LSTM-GBRT	LSTM层
	时间间隔	8	10	6
	数量的隐藏层	2	2	2
	隐藏层单元的数量	64年	16	32
	GBRT层
	数量的树	101年	31日	41
	树的深度	1	1	1

LSTM-RF	LSTM层
	时间间隔	8	10	6
	数量的隐藏层	2	2	2
	隐藏层单元的数量	64年	16	32
	射频层
	数量的树	41	11	21
	树的深度	11	11	1

GBRT	数量的树	191年	11	11
GBRT	树的深度	21	1	1

射频	数量的树	11	31日	11
射频	树的深度	1	1	1

LSTM	时间间隔	8	10	8
	数量的隐藏层	2	2	2
	隐藏层单元的数量	64年	32	64年

4.4。精度测量

测量模型的预测精度与开发方法,实现一些评估标准,比如RMSE以及日军。一般来说,日军的衰落和RMSE将更精确的方法。然而,众所周知,对于一个给定的预测,实际结果上方和下方的预测使用日军和RMSE时被不对称55]。提到的原因,测量数据波动(例如,向上,稳定,或向下),方向匹配率(Dsta)工作。此外,我们利用平均绝对误差(激射微波)评估如果发达预测方法都天真的预测方法(56]。日军的详细描述、RMSE Dsta,和激射微波标准,请参阅附录B。

5。实证结果

5.1。每天、每周和每月CBCFI预测

在确定的最佳网络结构预测任务,训练集是用来训练我们LSTM-EL模型直到收敛。评估使用测试集进行。分析混合LSTM-EL结构的普遍性,我们与日常使用一个数据集,周而复始,环比基地。具体来说,每周和每月的数据计算的平均每日CBCFI。此外,为了避免过度拟合问题,及早停止和验证集是在目前的研究中,利用和百分比的培训,测试,和验证集是60%,20%,和20%,分别。

在我们预测的预测方法、LSTM-RF LSTM-GBRT, GBRT,射频应用模型,都是评估通过计算日军,RMSE Dsta,激射微波。滚动的方法实现进行第二天/每周/每月CBCFI预测。使用的方法预测变量的实际值在前一时期的预测在测试集。注意,时间间隔是固定的,并为进一步添加新数据t+ 1的预测。图7显示滚动的方法是如何工作的。

注意,在每周的预测,每一个点代表了每周CBCFI价值和一个新的每周CBCFI值是计算每一个新的5每天CBCFI值(只有工作日数据)。同样,在月度预测,每个点代表每月CBCFI值和一个新的月度CBCFI值计算工作日的每一个月,自动排除周末(周六和周日)。

我们接下来进行每日、每周和每月CBCFI预测实验,分别。CBCFI数据从2012年1月至2020年10月示例数据。评估LSTM-EL模型的预测性能,我们将数据分为训练数据,验证数据和测试数据。每个数据集的比例是6:2:2。图8显示了学习曲线的均方误差(MSE)验证数据和100年的训练数据时代在每天,每周,每月的预测情况。学习曲线显示一个不错的选择,因为减少训练和验证输给一个稳定的数据与最小两个最终损失值之间的差距。

(一)

(b)

(c)

表5比较两种混合LSTM-EL方法的预测性能与相应的单一EL方法在滚动预测方法。每日CBCFI预测的情况下,我们发现,定向匹配和错误的预测性能增强的介绍提出了混合结构。和所有激射微波的值小于1表明,四种方法优于一步天真的平均预期。注意,日军的预测性能,RMSE, Dsta改善通过考虑混合结构预测。与相应的单一方法的预测性能相比,改进百分比(改进百分比计算的评价指标间的差值混合模型和传统模型在传统的模型)在日军LSTM-GBRT LSTM-RF 22.47%和24.59%,分别RMSE 41.54%和24.73%,分别和Dsta分别是72.84%和69.36%。上述结果表明,LSTM-GBRT展览水平最重要的改进。


方法	日军(%)	RMSE	激射微波	Dsta

每日CBCFI预测培训周期:2012/1/4∼2017/4/10 测试周期:2019/1/7∼2020/10/13

LSTM	9.15	0.2419	1.1532	0.5703
GBRT	7.84	0.2342	0.8915	0.5145
LSTM-GBRT	6.00	0.1369	0.9132	0.8893
射频	8.62	0.2034	0.8370	0.5042
LSTM-RF	6.50	0.1531	0.9560	0.8539

每周CBCFI预测培训周期:2012/1/9∼2017/3/24 测试周期:2019/1/21∼2020/9/28

LSTM	9.47	0.1931	1.6532	0.4303
GBRT	8.99	0.1815	0.6173	0.5324
LSTM-GBRT	4.08	0.1232	0.9835	0.8034
射频	7.32	0.1673	0.5525	0.4853
LSTM-RF	4.43	0.1476	0.8941	0.8113

每月CBCFI预测培训周期:2012/1/4∼2017/3/4 测试周期:2019/4/1∼2020/10/13

LSTM	11.53	0.2571	1.0126	0.5863
GBRT	10.89	0.2212	0.7940	0.5932
LSTM-GBRT	5.04	0.1099	0.9203	0.9024
射频	11.01	0.2236	0.7864	0.6072
LSTM-RF	4.25	0.0943	0.8825	0.9043

每周CBCFI预测情况下,符合日常CBCFI预测过程,性能增强错误和Dsta利率是积极的。改进百分比在日军LSTM-GBRT LSTM-RF是54.62%,39.48%,分别RMSE 32.12%和11.77%,分别和Dsta分别是50.91%和67.17%。此外,日军的改善两种LSTM-EL方法显示了每周CBCFI更高的意义比日常预测预测过程。因此,使用一个混合结构之间的时间特征提取功能LSTM-based预测精度提高。与日常信息相比,混合方法显示了每周CBCFI显著改善预测的过程。

因为预测长期CBCFI低频时间尺度数据提出了一些挑战,本研究调查了混合方法如何促进月度数据的预测是准确的。与每天和每周的预测一致,混合方法优于单一集成学习方法。值得注意的是,混合结构促进精度明显,日军改进GBRT和射频是53.72%和61.40%,分别。RMSE改善LSTM-GBRT LSTM-RF 50.32%和57.83%,分别。此外,激射微波混合方法的月度数据小于1,表明混合方法在这种方法优于平均一步天真的预测。

表6比较一般的预测性能的混合LSTM-EL方法在三个时间尺度。的和值表明,混合LSTM-EL方法在每周CBCFI表现最好的预测,实现改善最明显的月度预测的准确性。和不同方法的性能指标(表5)表明,LSTM-GBRT方法优于LSTM-RF在日常预测而LSTM-RF达到每周和每月的预测精度高,这表明LSMT-GBRT能更好地处理高频数据而LSTM-RF更适合中期或低频数据。


预测的准确性			改进百分比
每日预测	每周的预测	月度预测	每日预测	每周的预测	月度预测

6.25%	4.26%	4.65%	23.53%	47.05%	57.56%
0.1450	0.1354	0.1021	33.14%	21.95%	54.08%

请注意。和代表平均的日军和RMSE值。每个平均日军/ RMSE计算的平均日军/ rms LSTM-GBRT和LSTM-RF表5。

图9显示了真正的CBCFI值和预测值之间的比较由LSTM-EL方法及其相应的单一EL方法。图的插图广场9(一个)显示了混合和单一EL方法执行上升趋势,底部,下降趋势。发现四个方法能够预测每日、每周、月度趋势CBCFI,但LSTM-EL方法得到的输出低于实际CBCFI值。在三种情况下,单一的EL预测显示,实际CBCFI值没有明显的波动。例如,在情况我在2019年1月开始,上下GBRT和射频预测显示严重时不发生实际CBCFI趋势,LSTM-GBRT LSTM-RF仍然保持接近真正的CBCFI值,和类似的现象是观察到的第二和第三的情况下。

(一)

(b)

(c)

数据9 (b)和9 (c)表明,单一GBRT和射频在每周和月度预测模型产生大的错误,尤其是在趋势线的底部或顶部。相比之下,混合LSTM-EL预测方法繁殖CBCFI趋势和产生相对较小的错误。例如,在每周的预测在2019年12月开始,在CBCFI从大约1000点跌至历史低点约450点,COVID-19爆发以来全球经济。CBCFI是保持在最低点,直到2020年5月,尽管疫情逐渐得到控制。在这种情况下,只有LSTM-GBRT和再现CBCFI LSTM-RF预测趋势,而其他方法显示大波动不存在实际的CBCFI本身。同样,在月度预测,单一EL方法GBRT和射频预测偏离,和LSTM-GBRT LSTM-RF预测非常接近实际CBCFI。

5.2。Diebold-Mariano (DM)测试

评估是否有统计上的显著差异之间的混合和传统模型,该Diebold-Mariano (DM)测试57)实现比较试样的预测结果。DM测试广泛应用于判断时间序列预测精度的差异从统计的角度大大不同的模型是至关重要的(58]。表7总结每天的DW测试的结果,每周和每月CBCFI数据集,分别。值小于0.05意味着拒绝零假设,没有区别这两种预测模型进行比较。可以看出LSTM-EL模型相比有显著不同的精度其他基准。日常数据集,LSTM-RF和LSTM-GBRT统计预测性能的差异与其他模型相比但是没有统计精度差LSTM-RF和LSTM-GBRT之间。同样,在每周和每月预测的情况下,将整体提供的预测改进学习算法是统计学意义而不同传统之间的预测改进整体学习算法或LSTM-based混合模型不显示统计预测性能。


数据类型	测试模型	参考模型
数据类型	测试模型	LSTM	GBRT	射频	LSTM-RF	LSTM-GBRT

每日CBCFI预测	LSTM	- - - - - -
	GBRT	2.4328	- - - - - -
	射频	2.4103	−1.6784	- - - - - -
	LSTM-RF	2.5123	2.2341	2.1231	- - - - - -
	LSTM-GBRT	2.2763	2.2910	2.8723	−1.2432	- - - - - -

每周CBCFI预测	LSTM	- - - - - -
	GBRT	−2.7084	- - - - - -
	射频	2.2034	−1.6110	- - - - - -
	LSTM-RF	2.2361	2.3414	2.6535	- - - - - -
	LSTM-GBRT	2.2276	2.3012	2.5541	2.6287	- - - - - -

每月CBCFI预测	LSTM	- - - - - -
	GBRT	−4.5123	- - - - - -
	射频	−5.2341	−1.9883	- - - - - -
	LSTM-RF	−5.2011	−6.1094	−5.3312	- - - - - -
	LSTM-GBRT	−5.1998	−6.2014	−6.4234	−2.6536	- - - - - -

请注意。 值是重要的为5%。

5.3。功能的重要性分析

此外,图10提出了排名的特性符合澄清方差促进LSTM-GBRT方法各自的特性。在这种情况下,功能策划反对他们的相对重要性,即百分比有关关键功能的意义。为简便起见,图10只介绍了前6特性与功能重要性的总和超过98%。可以清楚地看到,在天津港口煤炭库存影响每月CBCFI值但不重要的每天和每周的数据,这表明煤炭库存更可能影响长期预测而不是短期或中期预测。此外,国内外动力煤现货率和原油价格有明显影响日报,每周和每月CBCFI值,而煤炭库存和燃油价格对每日和每周CBCFI更重要。具体来说,广州Port-Q5500指数(澳大利亚煤炭)ext显示每日产生了极大的影响,每周、每月CBCFI值。此外,WTI原油现货价格具有明显影响日常CBCFI值,而每周CBCFI迪拜原油现货价格更敏感。这可能是因为这两个原油指数,主要服务于不同的地区。世界上最大的石油进口国,中国多年来一直加大购买美国原油(59]。WTI原油是指在美国石油从油井中提取,通过管道发送库欣,俄克拉何马州,美国的石油消费的主要指标(60]。原油代替煤炭,因此中国国内原油价格会更敏感,每日美国原油价格的变化。此外,由于原油是一种替代煤炭,煤炭价格的波动会影响大部分煤炭运输成本,因此CBCFI值将敏感WTI原油价格在短期时间尺度。另一方面,迪拜原油价格指数是主要参考波斯湾石油交付给亚洲市场,大约有一半(44.8%)的中国进口原油来源于九个中东国家(61年),CBCFI指数将迪拜原油价格变动的影响。此外,Nanovsky [62年]介绍了石油price-distance交互变量来解释全球贸易行为由于石油价格变化。他发现,当石油价格增加,国际贸易变得更加本地化的国家相对更多的和他们的邻居开始交易。相反,当他们减少,贸易变得更加分散,国与国之间的距离已变得不那么重要。因此,原油价格通常在一周呈现波动性,因此,每周一次的中国沿海航运成本可能看亚洲原油市场的价格。

(一)

(b)

(c)

5.4。CBCFI供给和需求的影响

CBCFI航运价格指数,除了上述因素外,供给和需求是必不可少的因素。CBCFI的供给应该可用的散货船和需求应该煤炭需要出货的数量。

在供应方面,具体地说,根据CBCFI航线和港口的供给应该是可用的散货船在天津港,金塘港,秦皇岛港口,Caofeidain端口和黄花端口。然而,我们没有发现任何可用的开源数据。

在需求方面,具体来说,CBCFI代表煤炭运输需要中国南方主要来自中国北方。国家统计局(图11)表明,大部分的煤用于热力发电(56.40%)和钢铁(18.1%)。因此,南方热发电和钢铁生产被认为是作为CBCFI-related需求的指标。然而,我们只发现了上面的一个全国性的数据基础,不能获取数据只有在中国南部。评估的需求,我们使用效用的总和南部沿海省份的电力消耗和至少一个港口城市包含在CBCFI路线,包括上海、江苏、浙江、福建、广东,南方热发电的替换。钢铁生产,我们使用国内钢铁总产量作为替代指标南部省份的钢铁产量。

(一)

(b)

此外,90%的煤炭资源在中国由自产煤炭进口主要来自中国北部和10% (47]。煤炭生产和煤炭进口也可能影响CBCFI-related需求。具体来说,增加煤炭生产和煤炭进口减少可能会增加CBCFI-related需求。因此,国内煤炭生产和煤炭进口也视为需求相关的因素。

注意,上述需求和需求相关的因素只能每月。因此,南部实用电力消费,国内钢铁生产,国内煤炭生产、煤炭进口被添加到每月的预测模型。

表8显示每月的预测性能的改进百分比增加需求和需求相关的因素。发现不同模型的预测性能有积极的改善和增加需求和需求相关的因素,特别是日军一个明显的改善(12.67%)和RMSE LSTM (10.01%)。混合模型,改进百分比在日军LSTM-GBRT LSTM-RF 5.32%和5.16%,分别和RMSE分别是5.18%和5.01%。图12礼物前7特性与功能重要性的总和超过98%。南部实用电力消耗排名最高,其次是广州Port-Q5500指数(澳大利亚煤炭)ext,国内钢铁消费,在天津港口煤炭库存。不是所有自产煤需要运输,国内煤炭生产展示了CBCFI预测不重要。上述结果说明,需求因素可能导致更高的月度预测精度。


评估标准	模型	每月预测的改进百分比(%)

日军	LSTM	12.67
	GBRT	9.97
	LSTM-GBRT	5.32
	射频	9.81
	LSTM-RF	5.16

RMSE	LSTM	10.01
	GBRT	8.90
	LSTM-GBRT	5.18
	射频	7.87
	LSTM-RF	5.01

6。结论

本研究试图在CBCFI提高预测的准确性通过制定一部小说混合LSTM-EL方法,能够提取有用的时间信息在数据结合LSTM技术和集成学习算法。滚动预测方法是为评估开发LSTM-EL预测精度相比,其相应的单一整体算法。此外,讨论了影响CBCFI值的关键因素和实验在每天,每周,每月滚动预测的时间尺度方法进行为了测试性能LSTM-EL方法的通用性。

这里的知识优势主要包括利用人工神经网络和集成的新兴方法学习方法是有用的方法来获得运费市场的非线性和非平稳的特性。根据实证结果,实现国内外动力煤现货率和原油价格有明显影响日报,每周和每月CBCFI值,而煤炭库存和燃油价格对每日和每周CBCFI更重要。预测的准确性,LSTM-EL方法比单一EL模型在三个时间尺度预测情况下比天真的预测并产生更好的结果。此外,精度改进LSTM-EL方法不同时间尺度数据集CBCFI验证。结果表明,混合LSTM-EL方法执行最好在日常CBCFI预测但达到最明显的改善在每周的预测精度。此外,DM测试实现评估是否有统计上的显著差异之间的混合和传统模型,结果表明,LSTM-based混合模型目前的统计差异预测性能与其他模型相比但是之间没有统计精度差LSTM-RF LSTM-GBRT,每周和每月的预测情况。总的来说,LSTM-EL方法具有很高的预测前景CBCFI指数以精确的方式。

提到新兴行为能力的方法是一种有效的工具,使基于不确定属性决定关于租船运输和进一步被航运业从业人员纳入管理工具包。开发方法和结果扩大运费预测研究表明可能的后续研究领域相关的方面。

附录

答:基本模型理论

深度学习的方法表现出一个杰出的性能与传统的统计数据包括方法,因为它能够为非线性映射的初始信息的方法,产生更有效的影响。和长时间的短期记忆(LSTM)基于递归神经网络(RNN)的概念,提出了一种杰出的能力在时间序列预测。另一方面,集成学习方法指的是机器学习技术相结合的几个基地方法为了最小化误差的原因在学习方法中,如噪音,偏见,和方差,提高整体预测性能的方法。本文专注于两种主流方法,(i)随机森林(RF)和(2)梯度提高回归树(GBRT)。(1)长短期记忆(LSTM),的LSTM,由Hochreiter。施密德胡贝尔表示是指在e特殊类型的递归神经网络(RNN) [63年]。LSTM由一组独特的记忆细胞,列车数据通过反向传播算法,能够解决RNN的长期依赖性问题,因此适用于时间序列问题。LSTM示意图的方法显示在图中13。LSTM选项来添加或删除数据的细胞条件,为实现使用细胞大门。标准LSTM可以表示如下。相应的步骤t及其对应的输入序列表示为 ,和盖茨的三种类型输入门 ,输出门 ,而忘记门。传递的信息可以确定是否被铭记或遗忘的隐层的输出和输入当前层。限制的激活函数输出数据的范围内(0,1)如下: 输入门旨在确定适当的输入信息( )细胞。其激活功能是设置忘记门。代表一个“候选”隐藏的状态决定从先前的隐藏状态和当前输入。表达的内存单元。实现的目的保留相应的信息,集成了之前的记忆,遗忘在乘法从大门,和新下面隐藏的状态下输入的乘法。门的输出控制数据输出。同样,旨在激活函数设置门这是遗忘。存储单元状态更新后的棕褐色h激活功能,点确定的乘法to-be-output信息。在哪里 , ,和表示重量和的矩阵 , , ,和表达有偏见的向量。(2)随机森林(RF)射频表达一个包含决策树学习算法相结合,引入了Breiman [40]。因此,每棵树的射频接收训练在一个单独的方式在一个独立的训练集的选择一个随机的方式。而不是传统的决策树,射频优势反映在两个方面。一方面,树木建造显示不一致作为引导中产生不同的训练集的二次抽样和各种随机细分集分割与特征的各自的树节点。另一方面,随机选择特性的子集。在这种情况下,射频可以实现低偏差和低输出方差和不容易陷入过度拟合(64年]。对于回归,最终预测的平均预测集的决策树。在射频,out-of-bag (OOB)错误率普遍服务是一种测量评价指标的意义(64年]。(3)梯度提高回归树(GBRT)一组成立与n例子和米特性 ,一棵树合奏方法适用K添加剂的功能预测输出。在哪里表示回归树空间。具体地说,表示各自的配置映射树一个实例有关叶指数,T表达树中的叶子的数量,和各自的代表一个单一的树结构和叶重。不一致的决策树,各自回归各自的叶子,树覆盖一个连续分数用于表示分数吗我叶。

b .评估标准

模型性能评估标准日军和RMSE以下公式: 在哪里n表示测试过程下的数据集的大小和代表实际和预测数据的时间t,分别。一般来说,RMSE和日军数据越低,越精确的方法。然而,特定的一组预测过程,实际结果,预测得到不对称下治疗当使用日军和RMSE [55]。因此,方向匹配率(Dsta)是用来测量数据波动(例如,向上,稳定,或向下),这被定义为 Dsta值的范围是[0,1]。Dsta数据越接近1,越大精度与direction-related预测过程关注的方法,反之亦然。此外,我们利用平均绝对误差(激射微波)评估拟议中的预测方法优于是否天真的预测方法(56]。在哪里表示预测错误决定( )和指的是天真的预测的错误。激射微波小于1,表明该方法生成一个更有效的预测比天真的预测计算。

数据可用性

这里适用的数据来源于公共风经济数据库,国际能源机构,中国国家统计局(National Bureau of Statistics)和Statista,数据可以得到评估https://www.wind.com.cn/en/edb.html,https://www.iea.org/data-and-statistics,http://www.stats.gov.cn/tjsj/,https://www.statista.com/statistics,分别。

的利益冲突

作者宣称没有利益冲突。

确认

这项工作是财务支持的关键研究和发展计划的科学技术部、中国(没有。2018 yfb1601402),能源基金会(项目:初步调查和研究货运行业,没有。VQ99QT1136Y17005)和国家工程实验室的开放研究基金综合交通大数据应用技术(没有。CTBDAT201912)。

引用

m . Stopford,“航运船舶已经改变了世界和社会的影响,“全球海上环境国会7卷,1 - 10,2010页。视图:谷歌学术搜索
对CBCFI SSE,”,”2020年,https://en.sse.net.cn/indices/introduction_cbcfi_new.jsp。视图:谷歌学术搜索
上交所,推广CBFI、上交所、珀斯、英国、2020。
x叮,s .戴f . Chen等人“长期记忆和扩展行为的研究大部分运价波动与结构性突变,”交通信,10卷,不。6,343 - 353年,2018页。视图:出版商的网站|谷歌学术搜索
y口,m·罗和y赵,“检查theoretical-empirical矛盾平稳性的运费率,”海事政策与管理,45卷,不。2、145 - 158年,2018页。视图:出版商的网站|谷歌学术搜索
j .刘和f·陈“不对称波动变化在不同的干散货运价市场结构下休息,”自然史答:统计力学及其应用卷,505年,第327 - 316页,2018年。视图:出版商的网站|谷歌学术搜索
j·施密特,m . r . g .品牌美国实现和m·a·l·品牌”的最新进展和应用机器学习在固态材料科学,”NPJ计算材料,5卷,不。1,p。83年,2019。视图:出版商的网站|谷歌学术搜索
d·沃尔夫和美国Neugebauer”,基于树的机器学习的方法对股票市场预测,”《资产管理,20卷,不。4、273 - 288年,2019页。视图:出版商的网站|谷歌学术搜索
j .杨赵c、h . Yu和h·陈,“使用GBDT预测股市,”Procedia计算机科学卷,174年,第171 - 161页,2020年。视图:出版商的网站|谷歌学术搜索
杨,j .吴杜y, y,他和陈x,“整体学习短期流量预测基于梯度增加机器,”杂志上的传感器卷,2017篇文章ID 7074143, 15页,2017年。视图:出版商的网站|谷歌学术搜索
张x m . y . Chen m . g . Wang y . e .通用电气和h·e·斯坦利”一种新的混合方法,波罗的海干散货运价指数预测基于动态波动网络和人工智能方法相结合,“应用数学和计算卷,361年,第516 - 499页,2019年。视图:出版商的网站|谷歌学术搜索
BalticExchange,“BDI概述”,2021年,https://www.balticexchange.com/en/index.html。视图:谷歌学术搜索
波罗的海干货指数w·汉森”理解。学习市场”,2021年,https://www.learningmarkets.com/understanding-the-baltic-dry-index/。视图:谷歌学术搜索
k·p·b·Cullinane k·j·梅森,m .斗篷,“比较模型的预测波罗的海运价指数:box-Jenkins重新审视,“国际海事经济学杂志》上,1卷,不。2、15 - 39,1999页。视图:出版商的网站|谷歌学术搜索
m·g . Kavussanos和a . h . Alizadeh-M季节性模式在干散货船运地点和时间租船运费,”运输研究E部分:物流和运输审查,37卷,不。6,443 - 467年,2001页。视图:出版商的网站|谷歌学术搜索
r·巴舍乐a Alizadeh,即运价指数”预测现货和期货价格在国际货运市场,”国际期刊的预测,23卷,不。1,第114 - 101页,2007。视图:出版商的网站|谷歌学术搜索
诉Tsioumas s Papadimitriou y Smirlis, s . z,”一个新颖的方法来预测散装货物市场,”《亚洲航运和物流,33卷,不。1,33-41,2017页。视图:出版商的网站|谷歌学术搜索
陈,h . Meersman,大肠Voorde”预测现货率主要干散货市场的路线,“海洋经济与物流,14卷,2012年。视图:出版商的网站|谷歌学术搜索
r .不言自明,f . e . Benth和s . Koekebakker“多元建模和分析区域海洋运费”运输研究E部分:物流和运输审查卷,113年,第221 - 194页,2018年。视图:出版商的网站|谷歌学术搜索
m . stopfor海洋经济劳特利奇,埃文斯顿,美国,2013年。
戴,f·陈,曾庆红y、x曾庆红,“扩展行为的散货运价波动降噪前后,“上海交通大学学报(自然科学),21卷,不。6,655 - 661年,2016页。视图:出版商的网站|谷歌学术搜索
j·李·m·g·帕森斯,“使用神经网络预测油轮运价,”海事政策与管理,24卷,不。1,9-30,1997页。视图:出版商的网站|谷歌学术搜索
h·杨,f .董和m . Ogandaga”前兆的航运市场运价的基于支持向量机,”学报第六届交通运输研究的国际会议大会(ICTTS),南宁,中国,2008年8月。视图:谷歌学术搜索
e . Thalassinos m·哈尼亚,p·柯蒂斯j . Thalassinos海洋导航和海上交通安全:STCW,海事教育和培训(遇到),人力资源和船员曼宁,海事政策、物流和经济问题美国佛罗里达州波卡拉顿,CRC新闻,2013年。
关,z, k . Wang x的歌,和j·高,“多步混合预测模型管理指数基于支持向量机,对波罗的海”神经网络世界,26卷,不。3、219 - 232年,2016页。视图:出版商的网站|谷歌学术搜索
b .Şahin s Gurgen b Unver写道,İ。Altin”,波罗的海干货指数预测通过使用人工神经网络方法,”土耳其的电气工程和计算机科学杂志》上26卷,第1684 - 1673页,2018年。视图:谷歌学术搜索
d . m .问:纳尔逊·a·c·m·佩雷拉和r·a·d。奥利维拉,“股票市场的价格波动与LSTM神经网络预测,”《2017年国际神经网络(IJCNN)联合会议安克雷奇,页1419 - 1426年,正义与发展党,美国,2017年5月。视图:谷歌学术搜索
马c . c . Wu, y, r·鲁”一个新的预测框架与LSTM比特币价格,”学报2018年IEEE国际会议数据挖掘研讨会(ICDMW)新加坡,页168 - 175年,2018年11月。视图:谷歌学术搜索
z赵,w·陈,吴x, p . Chen和j·刘,“LSTM网络:短期流量预测,深度学习的方法”专业智能运输系统11卷,第75 - 68页,2017年。视图:谷歌学术搜索
y段、l . v .干和F.-Y。王”,与LSTM神经网络行程时间预测,”学报2016年IEEE 19国际会议上智能交通系统(ITSC)里约热内卢,巴西,2016年11月。视图:谷歌学术搜索
y列昂诺夫和诉Nikolov”,小波和神经网络模型对干散货航运指数的预测,”海洋经济与物流,14卷,不。3、319 - 333年,2012页。视图:出版商的网站|谷歌学术搜索
e . Bulut o . Duru, s .吉田“模糊逻辑(FILF)预测模型集成在干散货航运时间宪章利率:一个向量自回归设计模糊时间序列的模糊c均值聚类,“海洋经济与物流,14卷,不。3、300 - 318年,2012页。视图:出版商的网站|谷歌学术搜索
问:曾,c, A .刘贤Ng和x赵,“波罗的海干散货运价指数的新方法预测基于经验模态分解和神经网络,”海洋经济与物流,18卷,不。2、192 - 210年,2016页。视图:出版商的网站|谷歌学术搜索
k . Uyar U。ilhan, a .İlhan”长期干货运费通过经常性的模糊神经网络,预测”Procedia计算机科学卷,102年,第647 - 642页,2016年。视图:出版商的网站|谷歌学术搜索
i m·卡马尔h . Bae s Sunghyun h .云,“整体学习缝补:深模型短期和长期预测的波罗的海干散货运价指数,”应用科学,10卷,不。4 p。1504年,2020年。视图:出版商的网站|谷歌学术搜索
y s . j . d . r . Liu Lee黄和c j .赵“空气污染预测基于LSTM基于神经网络和集成学习的关注,“专家系统37卷,文章ID e12511, 2020。视图:出版商的网站|谷歌学术搜索
s . m . Tan元,s . Li y苏,h·李和p.h.他“Ultra-short-term工业电力需求预测使用基于LSTM混合集成学习,”IEEE电力系统,35卷,不。4、2937 - 2948年,2020页。视图:出版商的网站|谷歌学术搜索
段l和m . Binbasioglu”一个社区检测框架”工业信息集成的杂志5卷,1 - 5,2017页。视图:出版商的网站|谷歌学术搜索
j·h·弗里德曼“随机梯度推进”,计算统计和数据分析,38卷,不。4、367 - 378年,2002页。视图:谷歌学术搜索
l . Breiman“随机森林”,机LearningMachine学习,45卷,不。1,5-32,2001页。视图:出版商的网站|谷歌学术搜索
风https://www.wind.com.cn/en/default.html2021年。
c . m . Jarque和a·k·贝拉”有效测试正常,方差齐性和串行回归残差的独立性,”经济学的信件,7卷,不。4、313 - 318年,1981页。视图:谷歌学术搜索
d·a·迪基和w·a·富勒分布估计的自回归时间序列单位根,”美国统计协会杂志》上,卷74,不。366年,第431 - 427页,1979年。视图:出版商的网站|谷歌学术搜索
n·戴维斯和j . d . Petruccelli“检测非线性时间序列,统计学家,35卷,不。2、271 - 280年,1986页。视图:出版商的网站|谷歌学术搜索
r s -蔡“4.2章非线性测试”金融时间序列的分析美国新泽西州霍博肯市威利,第3版,2010年版。视图:谷歌学术搜索
韩宇奇l, c . Haozhou r, y Kunpneg,分析影响煤炭价格的因素的新常态下中国经济研究平方、杜伦、数控、美国、2020。
s . Cornot-Gandolphe中国煤炭市场:北京能驯服“煤炭王”?英国牛津大学能源研究及牛津大学2014年https://www.oxfordenergy.org/wpcms/wp content/uploads/2014/12/cl - 11. - pdf。
n . Zamani“原油和煤炭市场之间的关系:一个新的方法,”国际能源经济和政策杂志》上》第六卷,没有。4、801 - 805年,2016页。视图:谷歌学术搜索
郭x, j·史,d .任”在中国煤炭价格预测和结构分析,”离散动力学性质和社会卷,2016篇文章ID 1256168, 7页,2016。视图:出版商的网站|谷歌学术搜索
p . Schober、c·布尔和洛杉矶Schwarte,相关系数:适当使用和解释,“麻醉与镇痛,卷126,不。5,2018。视图:出版商的网站|谷歌学术搜索
n .雷蒙和i Gurevych最佳hyperparameters深LSTM-networks序列标签任务,”2017年,https://arxiv.org/abs/1707.06799。视图:谷歌学术搜索
g·h·t·里贝罗g p s d。m .否决权g·d·c·卡瓦尔康蒂和i r . Tsang“延迟选择时间序列预测使用粒子群优化”Proceddings 2011国际联合会议上的神经网络圣何塞,页2437 - 2444年,CA,美国,2011年。视图:谷歌学术搜索
Scikit-learn.org,”参数估计使用网格搜索和cross-validation-Scikit-learn 0.19.1文档,”2021年,http://scikit-learn.org/stable/auto_examples/model_-selection/plotgrid_search_digits.html。视图:谷歌学术搜索
李x l .彭x姚明et al .,“长期短期记忆神经网络对空气污染物浓度预测:方法开发和评估,”环境污染卷,231年,第1004 - 997页,2017年。视图:出版商的网站|谷歌学术搜索
j·麦肯齐”,平均绝对百分误差和偏差在经济预测,“经济学的信件,卷113,不。3、259 - 262年,2011页。视图:出版商的网站|谷歌学术搜索
r . j . Hyndman和a·b·克勒”另一个看看预测精度的措施,”国际期刊的预测,22卷,不。4、679 - 688年,2006页。视图:出版商的网站|谷歌学术搜索
x Diebold弗朗西斯·r·s·马里亚诺·“比较预测的准确性,”商业和经济统计》杂志上,20卷,不。1,第144 - 134页,1995。视图:谷歌学术搜索
h . g . Li的歌,和s·f·威特,“最近的事态发展在计量经济学建模和预测,”旅游研究杂志》,44卷,不。1,第99 - 83页,2005。视图:出版商的网站|谷歌学术搜索
WorldOil”,中国购买了美国数百万桶石油遵守贸易协议,”2021年,https://www.worldoil.com/news/2020/8/18/china-buys-millions-of-barrels-of-us-oil-to-comply-with-trade-deal。视图:谷歌学术搜索
能源信息管理局,“基准定价原油中发挥重要作用,”2020年,https://www.eia.gov/todayinenergy/detail.php?id=18571。视图:谷歌学术搜索
d .工人”,中国前15名原油供应商,”2021年,http://www.worldstopexports.com/top-15-crude-oil-suppliers-to-china/。视图:谷歌学术搜索
s . Nanovsky“贸易油价的影响,”回顾国际经济,27卷,不。1,文章ID e0001, 2019。视图:出版商的网站|谷歌学术搜索
,的Hochreiter和j。施密德胡贝尔表示“长短期记忆。”神经计算,9卷,不。8,1735 - 1780年,1997页。视图:出版商的网站|谷歌学术搜索
r . Diaz-Uriarte和s·阿尔瓦雷斯德安德烈斯,”基因微阵列数据的选择和分类使用随机森林,”BMC生物信息学,7卷,不。1,p。2006。视图:出版商的网站|谷歌学术搜索

《先进的交通工具

先进的数据情报理论与实践在运输

文摘

1。介绍

2。文献综述

3所示。数据描述

3.1。数据源

3.2。CBCFI影响因子数据

3.3。变量相关分析

4所示。方法

4.1。问题陈述

4.2。准备数据

4.3。LSTM-Ensemble学习(LSTM-EL)方法CBCFI预测

4.4。精度测量

5。实证结果

5.1。每天、每周和每月CBCFI预测

5.2。Diebold-Mariano (DM)测试

5.3。功能的重要性分析

5.4。CBCFI供给和需求的影响

6。结论

附录

答:基本模型理论

b .评估标准

数据可用性

的利益冲突

确认

引用

版权

更多相关文章

相关文章