文摘
研究的分类和演化的关键技术在交通运输领域,36权威科学期刊的数据在交通领域从网上收集的科学核心数据库收集从2001年到2020年。基于文献计量的方法,本研究使用Python处理和可视化数据,结合文献VOSviewer协助数据可视化软件。首先,数据预处理算法旨在删除处理收集到的数据,合并同义词,并提取关键技术。然后纸质记录包含的关键技术词典被过滤掉。接下来,年度出版物和关键技术随着时间的推移被数的分布。最小二乘法用于符合分布的年度出版物的比例,和斜率k1拟合线性回归方程是用来确定关键技术的研究趋势。关键技术被分成“热技术,”“冷技术”和“其他技术,”根据研究热的趋势。为了进一步探索研究热点,也是使用最小二乘方法适合所有技术获得斜率的引用k2。我们使用高斯混合模型(GMM)集群算法k1和k2每种技术。结果,144技术被分成13 super-key技术,60关键技术,59相对关键技术,和12个低调技术。然后,关键技术的进化从两个角度分析了加权进化的进化和累积。和交通领域的技术发展的趋势在过去的20年里探索。最后,同现采用聚类方法把关键的交通技术分为五类:汽车技术和控制,优化算法和仿真技术、人工智能和大数据,物联网和计算和通信技术。研究结果可以为不同的人提供参考在交通运输领域,包括但不限于研究者,期刊编辑和资助机构。
1。介绍
经济和社会前所未有的超级快速发展阶段,新兴和颠覆性的技术。Burgelmanet将技术定义为“技术指的是理论和实践知识、技能和工件,可用于开发产品和服务及其生产和交付系统”(1]。技术是最具生产力的手段,渗透到社会生产的各个方面,促进各行业的转换的决定性因素。他们已经改变了人们出行的方式,从步行和马车第一个人类蒸汽汽车、飞机、高速列车、地铁、共同的旅行,和无人驾驶汽车。此外,技术将产生深远影响的结构和运行方式不同的运输和交通规则。虽然很难准确判断未来交通发展趋势,研究技术的发展和成熟会显著影响交通纪律和行业。在本文中,我们把这项技术应用于交通运输技术领域。
技术的应用而言,递归神经网络技术应用于GPS轨迹挖掘重建一个完整的公共交通网络(2),促进公共交通的发展。多输入和multioutput (MIMO)通信技术用于解决轨道交通通信能力(3]。云计算结合雾计算用于解决雾高峰时期计算性能退化(4]。增强现实(AR)是用来模拟屏幕交流沟通的无人驾驶车辆在路上遇到危险和有意的行为。研究信任,可用性,和经验5),物联网的自动驾驶汽车用户可以应用于随机早期检测车辆动态。它可以应用在路口接口主动探测初期的拥堵,最好设置交通信号灯的周期和阶段(6]。深度学习用于预测[拥挤现象7],短期交通流预测[8),行人行为识别(9,10),为自动驾驶车辆的驾驶策略(11],车牌分割和识别12- - - - - -14]。此外,mobile-edge计算(15)、铁路交通冲突控制(16),和联邦学习(17)也被应用于运输。
文献计量学是一个复杂的主题广泛的信息科学的结合,哲学,和统计期刊或特定字段(18]。文献计量学指标和工具的帮助下,期刊的特点、关键词和热门话题可以探讨19]。有一些尝试的主题提取交通从文献计量学和研究趋势分析。基于文献数据发表在IEEE智能交通系统从2000年到2009年,Cobo et al。20.)使用coword分析检测、可视化和评估其概念和主题领域。王等人。21),根据文章的IEEE智能交通系统(2010 - 2013),研究了智能交通系统的生产率和协作模型。唐et al。22)分类主题类别的不同研究领域的核心文章IEEE(2010 - 2013)的智能交通系统coword分析,包括车辆控制技术、建模、仿真、图像处理。Moral-Muoz et al。23)用高被引文献来研究科学的参与者为智能交通系统的发展做出了重要的贡献。Davarzani et al。24)使用文献计量学和网络分析工具来识别关键人员,合作模型,研究集群,在绿色港口和海上物流的关系。杂志等。25)进行大数据技术的文献综述能力在供应链,建立了技术能力成熟度模型。田et al。26)网络分析和聚类分析用于确定交通碳排放的趋势和特点。基于所选书籍或书章节和162项研究发表在48学术期刊在1979年至2018年之间,Alexandridis et al。27]调查所有出版研究航运领域的融资和投资。周et al。28]分析704篇论文发表在交通调查从2007年1月至2019年6月,《华尔街日报》的发展现状和新兴趋势。通过文献分析,李et al。29日)所有期刊的统计分析,有影响力的论文,主要贡献者,主题瓶颈模型的研究在过去的半个世纪。迈耶(30.系统地和定量地回顾了文学与文学道路货运的脱碳耦合和cocitation分析。米尔阿卜杜勒贾巴尔et al。31日]分析了328从2000年到2020年从斯高帕斯数据库期刊论文探索micromobility研究的变化趋势。
同时,文献等软件VOSviewer CiteSpace也有助于研究进展和识别的特点。例如,TR-Part B的论文分析了从1979年到2019年与VOSviewer [32]。刘等人。33)使用CiteSpace和VOSviewer识别的研究进展和趋势在文献计量学交通预测。基于1045年的数据文档从计算机辅助土木与基础设施工程从2000年到2019年,王et al。34]分析了这些文件与VOSviewer CiteSpace的特点。
大部分的研究都集中在特定的领域,比如,大数据分析,micromobility,和交通预测,而不是进行系统回顾影响运输的所有技术的发展。具体来说,尽可能多的技术被应用于交通工具,应该有一些交通技术的分类和演化研究。然而,很少有研究分析技术越来越流行或不受欢迎,他们可以分为多少类,以及它们是如何随着时间的推移演变。因此,本文收集的数据来自36个权威SCI期刊文献计量分析交通在过去20年。然后,交通分布的关键技术在最近的20年里,随着时间的推移,研究热点的变化趋势,研究热点和交通关键技术的进化和分类进行了探讨。本文将揭示的关键技术的分类和演化趋势的交通运输和挖掘研究的热点技术。希望研究人员的关键运输技术可以更好地理解有关此研究的发展现状。
2。数据集和预处理
2.1。数据集
在这项研究中使用的数据来自科学的网络数据库,这是最大的,最跨学科,权威和影响力的综合性学术信息资源。它包含全世界有超过8700的学术期刊,涵盖自然科学、社会科学、生物医药、工程技术、人文艺术等领域。
36 SCI期刊2019年交通科技JCR科里侗6月29日发布的报告,2020年,在从2001年到2020年。一般来说,技术在交通领域的应用将发表在这些36 SCI交通权威期刊。2021年4月24日,有56451个样本检索,并导出的记录内容是一个完整的记录。表中所示的字段1和期刊缩写检索表所示2。
2.2。数据预处理
本文针对关键技术,技术关键字过滤的关键词。和数据预处理算法如图1。是否作者的关键词是空应该首先来判断,如果他们,代之以更多的关键字,这可能代表了文章。如果作者关键字和额外的关键词都是空的,应该删除记录,留下这一步后51457条记录。每年的保留记录,高频关键词也计算在内,比如本文中的前100,然后手动删除非技术关键词,如“环境”,“资源”和“汽车”或其他名词。在那之后,最初获得关键技术词库。然后,同义词合并,如单数、复数,缩写,得到144个关键技术词汇,最后关键技术词库。根据关键技术词库,论文的关键词库筛选出来。非技术关键词从筛选记录删除,最后得到了15449条记录。
3所示。方法
本文基于文献计量学,用Python程序的数据。与此同时,VOSviewer和Python是用来做数据可视化。
3.1。构建同现矩阵
人们普遍认为,有一个给定的关键字之间的相关性在同一篇论文中,和同现的频率可以表达这种相关性。越对单词出现在同一篇论文中,越接近这两个词之间的关系。同现矩阵构造了根据单词的频率在同一篇论文中。如图2,一条记录代表一个文档。图2(左)表示文档中的关键字。图2(右)代表关键词同现的频率,与对角线代表一个关键词出现的次数在所有的文件。
3.2。同现集群
共存集群用于集群的关键技术,它是基于距离的关系中的每一项统计数据库,主要思想的欧几里得度量重量之和最小化所有个人在每个类别之间的距离矩阵由数据库。在这项研究中,所构造的同现矩阵转化为。net VOSviewer可以识别的格式。
3.3。学位中心
该指数用来衡量网络中一个节点的位置称为学位中心。如果一个节点与许多其他人来说,这可能是网络的中心。在文献计量学,分直接连接到节点的数量通常是用来测量中心的程度。例如,更多的关键字出现在一起与其他关键词,核心关键词是越多。
3.4。一年一度的比例
年度比例是一个关键字的出现频率除以总所有关键词的出现频率。一年一度的比例越大,越受欢迎的关键字的研究在这一年,反之亦然。
3.5。最小二乘拟合
每种技术的研究热趋势随着时间的推移,使用最小二乘20年来适合每个技术的比例。解决了线性回归方程如下: 在哪里今年,是比例的研究,斜率,是拦截。
3.6。加权和累积演化路径
加权和累积的进化路径法被用来从不同角度分析关键技术的发展趋势。公式(2)是用来计算的加权平均发生时间不同的长轴的关键技术研究: 在哪里是加权平均发生时间,是今年的关键技术出现了,然后呢关键技术的频率,发生在那一年。
累积的进化路径,统计方法如下: 在哪里是时候关键字出现在累积进化图和是时候关键字研究中首次出现。
的两个方法,每个关键字的出现频率是需要计算。和统计公式如下: 在哪里是总关键词的出现频率在所有多年的研究。
3.7。高斯混合模型(GMM)算法
GMM指的是多个高斯分布函数的线性组合。从理论上讲,GMM可以适合任何类型的分布。它通常是用来解决问题的数据在同一组包含多个不同的分布。考虑到随机变量X,GMM可以表示如下: 在哪里是kth模型的高斯混合模型,和的均值和方差是吗kth高斯模型,分别是混合系数,即体重。它需要满足下列条件:
4所示。数据可视化
4.1。量分析
15549年的文献计量分析预处理的论文是在本研究进行的。在某种程度上,纸卷的变化代表了这一领域的研究现状。图3显示了所有的期刊上发表的论文数量。图3(一个)说明了一年一度的体积,和图3 (b)代表累积体积的出版物。如图3(一个)的整体体积出版物慢慢地从2001增加到2014。然而,它有一个相对快速增长从2014年开始,特别是2017年之后,它几乎成倍增加。图3 (b)显示了指数增长的累积曲线出版物。自2014年以来,运输关键技术应用到解决交通问题研究发展迅速,越来越多的学者关注。
(一)
(b)
此外,每个杂志的年度卷和每个国家的体积也计算,如图4。图4 (b)只显示前30个国家。可以看到,《IEEE T Veh抛光工艺最重要的体积(4951),超过三次的IEEE T智能透明,表明它更关注运输关键技术的研究。就国家而言,美国是最重要的贡献者(3477),其次是中国(2903),近三倍的第三大,加拿大,表明美国和中国已经为这一领域做出了重要的贡献。
(一)
(b)
4.2。随时间分布的关键技术热点
探索每年关键技术的研究重点,本文统计了交通量根据年度部门,如图5,显示了十大交通技术。优化、车辆技术和运输技术在过去的20年里很受欢迎。优化和车辆技术研究在过去的20年里在前十,主要技术应用于运输。
图6给出了一个更直接的比例每年每个技术的研究。图6(一)显示的百分比各流量技术随着时间的推移,与一个区域代表比例和一个更大的区域代表更多的论文和研究更受欢迎。图6(一)只显示前10位技术,和图6 (b)显示的年度百分比变化。如图6,一些技术优化和声望和汽车技术几乎没有差异主要是在峰值。另外一些人,如CDMA(码分多址)是逐年减少。
(一)
(b)
相反,一些技术,比如电动车(电动车),逐年增加。先增加,然后降低和一些技术,比如OFDM(正交频分复用),与重大波动。此外,一些技术,如GA(遗传算法)波动,但总体比例是相对稳定的。
4.3。分类关键技术变化的趋势
区分趋势技术,本文的技术类别定义为“热技术,”“冷技术”和“其他技术。“热门技术代表技术越来越受欢迎,冷技术意味着技术正变得不那么受欢迎,和其他人是其他技术。本文使用最小二乘拟合方法适合每个20年来技术的百分比变化和判断的技术类别根据斜率范围拟合线。拟合结果如图7,曲线代表的是原始数据,直线代表拟合的线性回归方程。根据实验,热技术是斜坡k1超过0.00005,冷技术不到−0.00005,否则对其他技术。如图860、144技术分为热技术,38 46冷技术和其他技术。
(一)
(b)
(c)
(一)
(b)
(c)
在某种程度上,这一趋势的出版物数量的变化可以反映技术的研究热情。然而,在研究领域,论文的引用率通常是作为一个重要的参考指数的研究热点。为了进一步探索研究热点,最小二乘法还用于满足所有技术的引用来获取斜率k2。我们使用GMM集群算法出版卷的斜率k1和引用的斜率k2每种技术。聚类结果如图所示9(一个)。发现,由于大量出版物和引用的一些技术,如5克、深度学习、和电动汽车集群效果不是很好。因此,我们定义了技术和斜率k1大于3和引用的斜率k2大于21 super-key技术。其余技术分为3类,图中可以看到9 (b)。在图9 (b),红色的类别被定义为一个关键技术,绿色的类别相关的关键技术,和紫色的类别作为低调技术。
(一)
(b)
通过进一步使用GMM算法聚类分析,144年的技术被分成13 super-key技术,60关键技术,59相对关键技术,和12个低调技术。所有的技术及其分类如表所示3。其中,k1和k2super-key技术比别人大得多。对于关键技术,k1大于0.3,最多k2大于0。这两个k1和k2的相关关键技术接近0。值得一提的是,k2低调技术小于0,即使k1一些低调的技术更大,显示引用率的重要性的研究热点。
4.4。分析关键技术进化的
进一步探索关键运输技术的进化趋势,本文分析了加权进化和累积演化趋势,如图10。图10 ()代表了加权进化趋势,计算公式(2)和(4)。图10 (b)说明了累积的进化趋势,计算公式(3)和(4)。如图10在2012年之前,有一些关键的技术,虽然许多技术已经申请运输20年前,是矛盾的。几篇文章发表在2012年之前,导致整个研究时区被倾斜的时候加权。图10 ()表明加权时区为关键技术主要集中在2014 - 2018,并与高容量的技术大多是“汽车技术”,“电动汽车”,“优化”和“仿真”技术。后来加权时区,后来技术变得流行,代表当前研究热点话题;例如,“数字双”、“区块链”和“联合学习”出现近2020,表明这些技术是运输的最新研究。
(一)
(b)
图的横坐标10 (b)显示了今年第一次出现的技术。我们可以看到,大多数的技术在交通领域的20年前。2009 - 2016年期间,一些新技术的出现,只有一个新技术出现在2012年和2013年。新技术的出现增加了在此期间2017 - 2020。值得一提的是,“深度学习”,“5克,”“诺玛(非正交的多路存取),”和“边缘计算”出现在该领域最近的交通工具。不过,这些技术文件的体积相对较大,显示技术在交通研究新的和流行。
4.5。同现聚类分析的关键技术
基于上述研究,交通的关键技术是使用VOSviewer分为五类。如图11圆圈代表学位中心的大小。实线代表两种技术的共存和虚线表示相同的类别。五种技术如下所示:(1)汽车技术和控制。它包含了车辆技术、电动汽车技术,自动驾驶技术,和车辆控制技术,如最优控制和自适应控制技术。(2)优化算法和仿真技术。它主要包括优化,遗传算法,粒子群优化,整数规划和仿真技术。(3)人工智能和大数据。深度学习,它主要包括人工智能神经网络大数据,数据挖掘和数据分析。(4)物联网和计算。它主要包括物联网技术,汽车网络技术,隐私保护技术,云计算和计算技术。(5)通信技术。它主要包括无线通信技术,5 g技术,多输入multioutput技术LTE技术和CDMA接入技术。
5。结论
这篇论文进行了文献计量分析36权威科学期刊上发表的论文在交通领域在过去的20年。的体积在期刊上刊登的论文,它慢慢地从2001增加到2014,但自2014年以来迅速增长,并显著自2017年以来,它已经几乎成倍增加。至于国家出版卷,美国是最大的(3477),其次是中国(2903),加拿大近三倍,第三大。在研究热点的时间分布,一些技术,如优化和汽车技术已经流行了近20年,领先的技术应用于运输。一些技术,如CDMA,变得越来越不受欢迎。一些人恰恰相反,如电动汽车。研究一些技术,如热OFDM先增加后减少,显著的波动。有技术,如遗传算法、波动,但整体比例是相对稳定的。区分技术的趋势,144年技术分类根据斜率的线性回归方程最小二乘到60热技术,38 46冷技术和其他技术。进一步探索研究热点,也是使用最小二乘方法适合引用获得斜率k2。GMM算法用于集群k1和k2每种技术。结果,144技术被分成13 super-key技术,60关键技术,59相对关键技术,和12个低调技术。分析技术的演变进化从加权进化的角度和累积。运输的最新流行的技术是“数字双”,“区块链”,“联合学习,”等等,和“深度学习”,“5克,”“诺玛,”和“边缘计算”是近年来热技术重要的出版卷。运输的关键技术是由共存聚类分析分为五类:(1)车辆技术和控制类;(2)优化算法和仿真类;(3)人工智能和大数据类;(4)物联网和计算类;(5)通信技术。
本文在运输、分类和分析的关键技术的应用研究。需要注意的是,这项研究并没有透露关键运输技术进化的本质,这是超出了本文的范围,未来的研究可以进一步探讨。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称没有利益冲突有关这项研究的出版物。
确认
这项工作得到了中国国家重点研发项目(批准号2020 yfb1600400)。