科学规划

科学规划/2019年/文章
特殊的问题

数据驱动的科学编程计算智能

浏览特刊

社论|开放获取

体积 2019年 |文章的ID 5235706 | https://doi.org/10.1155/2019/5235706

Álvarorubio-largo,Juan Carlos Preciado,Luis Iribarne 科学编程的数据驱动计算智能",科学规划 卷。2019年 文章的ID5235706 4 页面 2019年 https://doi.org/10.1155/2019/5235706

科学编程的数据驱动计算智能

已收到 2019年7月22日
接受 2019年7月22日
发表 2019年8月19日

近年来,大数据及其在强化决策过程中提供宝贵见解的潜力吸引了学术界和产业界越来越多的兴趣。纵观历史,有些时代标志着社会的转折点。目前,我们正面临着其中一个转折点的开始,这是由于技术的优势而出现的一个新的进化飞跃,但它最近已经彻底改变了开发和编程的技术概念。我们正处在一个新的时代,数据的时代[1].

目前,每天产生的数据量非常高,来自不同的多个来源和不同的格式,通常设计有不同的目标、方法、概况和生产和消费节奏。在过去的几年里,企业、公共管理部门以及众多工业和科学研究设施产生的数据量已不可估量地增加,将传统系统变成了复杂或超复杂系统。这些数据可以是结构化的、半结构化的和/或非结构化的,从不同的来源提取,如自然语言处理[2](聊天机器人、评论和社交媒体)、多媒体内容(视频、图像和音频)、地理信息系统(GIS)或传感器(物联网/万物)在各种平台或环境(例如,机器对机器通信、社交媒体网站、传感器网络或自然互动)[3.].

这些是高度相关的数据,以至于在设计和开发未来的解决方案(或重新设计当前的方案)时必须考虑到它们。数据概念的正确演变至关重要,因为它对所属事业单位和企业的经济社会发展有着巨大的影响。

在这一新的大规模数据的新周期中,我们的主管部门,企业和公民产生了巨大的数据,他们自己的数据没有帮助我们在日常生活中或做出决策时,并因此对待这些数据的重要性将它们转化为对它们有用并相关的信息[4].

计算智能和大数据实践的发展激发了人们对分析解决方案越来越多的兴趣[5].准确的预测、趋势的精确识别和行为模式的发现可以优化资源的使用或消费,生成科学和研究领域的新知识,并在政治、天气、科学、研究、房地产、体育或医疗等社会应用领域实现更快、更好的决策[2].

迄今为止,提出的解决方案已经脱节,并且由于时尚或通过植入某种已知技术而实施的行动,但没有对数据量概念的特定需要的视角。挑战不再是技术的进化和发展,目前的问题与数据的生产和收购无关,现在我们正在对建立信息处理的新挑战和问题进行新的挑战和问题[6].基于这些概念和具有高可用性的复杂海量数据系统工程,我们看到计算智能环境被配置为一个系统,一个智能系统。在这种情况下,支持该系统设计的方法将首先要求计算智能系统的设计者,以确定对继续进行其他阶段所需的现有数据的需求。

巨大的数据采集使我们在尚未预期的规模上具有创新的大规模数据存储系统。这种大量数据呈指数级增长,并且在过去两年中仅创建了90%的全球范围数据[7].这些数据的管理和处理定义了一种新的知识管理范式,在应用于科学编程的计算智能领域,只有通过不断的方法和技术创新才能解决这一问题[8].

不同的数据源和格式导致复杂性,这使得决策昂贵,并且在实现大数据的实施,商业智能和业务分析不够的情况下,用户需要更多更好的了解数据方式。在这种情况下,数据可视化等技术进入了场景,这使得能够视觉简化从收集的数据构建的所有信息。该信息可视化支持通过报告和图形表示技术收集的数据的决策和高级分析,其中数据可视化容量使演员能够基于此数据和数据集在同一组数据集上灵活地构建必要的信息。将其或其他数据放在第三方的服务,因此提供了丰富的合作和创新的环境。One of the trends given clear importance by Computation Intelligence Systems is the visualization of information in a simple, agile, and powerful way, i.e., Computation Intelligence Systems makes possible the process data and display information quickly and in a reasonable time frame to assimilate all possible information by the people for whom it is intended. Definitively, the advance in technology and scientific programming we are experiencing plays an essential role in the evolution of computational intelligence environment [9].

计算智能技术形成了一组自然启发的计算方法和技术,这些方法和技术已经开发出面对上述复杂的科学编程,传统模型由于高复杂性,不确定性和过程的随机性而无法工作。这些技术通常包括并行/分布式模式识别技术,遗传编程,模糊系统或进化计算。这一特殊问题的整体目标是收集最新的研究调查结果,以及应用于科学规划的计算智能领域的最新问题和挑战。

此特殊问题被配置为关于在科学编程内部兴趣的热门话题的一系列论文,呈现和描述该领域的新研究或应用。有关相关研究人员的主要邮件列表中,发送并分发了几个论文的呼叫,以便将他们的研究提交给这项特殊问题。作为本领域目前的兴趣的一个例子,值得一提的是,对于这个特殊问题,我们总共管理了来自不同国家的15个高质量提交:西班牙,中国,印度,希腊,澳大利亚,英国,和越南。这些研究根据本期刊的条款和指导。至少两个专家审稿人审查了此特殊问题中包含的所有文件。此外,特别问题中的所有文件至少收到两项审查轮次。最后,在新兴研究领域的五篇高质量的纸张被接受纳入特殊问题(接受率= 5/15 = 33.33%)。总之,我们认为这些论文为我们带来了一项重要作品的国际抽样。

总的来说,这期特刊包含的论文主要涉及推荐系统、机器学习、模式识别、空间数据交互和复杂事件等领域的详细科学方面。研究进展应用于不同的社会领域,如智慧城市、科学数字图书馆、城市空间数据和公共卫生。

我们的第一篇论文的标题是“基于微博数据的城市系统空间互动研究:以惠河流域,中国,”由Y.Fan,J. Yao,Z. He,B。他和M. Li.本文通过新浪微博开放平台获得用户微博信息,并通过统计分析和空间分析研究城市空间模式和城市互动。本文将淮河盆地作为案例区域,以核实提出的提案。

第一篇论文的主要研究结论如下:(1)微博平台提供的数据接口可以研究城市空间格局。微博数据的用户轨迹可以探索区域城市空间关系,数据采集和数据质量评价满足研究需求;从网络连通性和城市相互作用两个方面分析了淮河流域城市系统空间格局的时空特征。研究发现,淮河流域城市空间关系具有以下特征:城市规模分布的空间差异明显;城市布局呈现分层聚集现象;高等级城市引领城市互动。

至于在城市研究中的微博数据的应用,目前的数据主要关注信息文本,社会关系等方面。该研究主要是关于事件检测和热点勘探。大数据思维和数据挖掘技术的结合将在城市问题研究中具有更多的研究结果。

第二本文件是“使用模式识别策略的实践经验,将软件项目计划转换为信息技术公司的软件业务流程”由C.Anvalo,I. Ramos,J.Gutiérrez和M.Cruz。作者提案提供了一个框架,可以在非处理感知信息系统(非Paiss)的数据库中生成将隐藏或浪费的软件业务流程。这种隐藏知识可用于实施信息技术公司(ITC)中的业务流程管理方法,这将帮助他们变得更具竞争力和降低成本。Compared to other business process discovery methods used with non-PAISs, their results are more adjusted to the reality of processes since they focus on transformations among artifacts that are close to executed processes that exist at different levels of abstraction (i.e., platform level and software expert level). Furthermore, business processes may be enriched with data regarding resources and costs that may also be bound to projects in project management systems. This way, new data will be available to set metrics and study key performance indicators of software business processes.

本文说明了Aqua-WS项目案例研究,以测试开发的MDA的路线图。在这种情况下,他们已经表明,生成的过程类似于商业软件专家可能设计的实际过程。出于这个原因,他们已经提供了一个半自动的建议来获得ITC的过程。作为未来的工作,作者称,他们将能够使用其他源系统,例如其他PMS,ECM,ERP,CRM,SCM或量身定制的软件。此外,他们将向特定的SPML或GPMLS目标提出路线图,由使用这种类型的系统使用的ITCS使用。在这种情况下,他们已经考虑了源系统,目标系统和启发式的以下各个方面,以生成业务流程。

我们的第三篇论文是“智能城市需求预测的高频数据驱动机学习方法”,J.C.Piniado,A. E.Prieto,R. Benitez,R.Rodríguez-echeverría和J. M. Conejero。本文提出了一种基于模式相似性技术的方法,以预测水需求,称为短期模式相似性(STP)。这项工作面临着在以前的方法中传统忽略的两个重要挑战,即高频的预测(基于分钟的测量)以及对诸如增加方法复杂性的年龄季节性或天气等外部数据的需求.在这种意义上,一方面,它基于1分钟的预测,另一方面,它不需要估计年龄季节性,因为它通过构建来确定这种季节性XY该系列已归一化的模式。

为了验证他们的方法,该研究在西班牙北部一个城市的三个不同地点进行了应用。获得的结果提供了有趣的见解,例如在高密度人口地区获得的最佳预测,在工业区确定星期日模式的困难,或在低密度地区较高的随机行为。此外,他们的模式相似性方法(STPS)也与其他类似的技术,已被用于水的预测,例如, 用水量预测( -WDF)和广义回归神经网络(GRNN)。获得的结果证明了 -WDF是最糟糕的结果的方法,而Grnn和STP则同样行动。作为未来的工作,作者试图管理已经以所提出的方法确定的一些弱点。首先,当考虑异常日时,预测成功较低。其次,目的是改善数据站点的结果,在那里显然没有规律性,例如我们的研究中的低密度人口区域,例如可以考虑更短的预测视野,例如4-6小时。尽管如此,这是一个遗骸目前未经测试的主题。最后,另一个有趣的进一步作品是在不同城市的应用方法中的应用,具有类似的水需求。

第四篇论文,“推荐和分类系统:系统映射研究”,J.G.G.NeRíquez,L. Morales-Trujillo,F. Calle-Alonso,F. J.Domínguez-mayo,以及J.M.Lucas-Rodríguez的系统映射研究。已经进行了本研究,以促进研究人员和从业者选择最合适的系统,技术或算法,包括在Adagio项目中以满足其要求。从这个意义上讲,本文提出了一个系统的映射研究(SMS),分析了推荐和分类系统的现有技术以及它们如何共同努力。然后,从软件开发生命周期的角度来看,该评论还表明,在ML(用于分类和推荐)研究和工业环境中的工作远非较早的阶段,如业务需求和分析。这使得能够从早期阶段寻找支持真实业务需求的高效和有效解决方案。然后,本文建议开发新的ML研究线,以促进其在不同域中的应用。作为未来的工作,作者提出了一个非常有趣的研究线可以专注于如何结合这些系统来获得更高效和有效的解决方案。

与大多数专注于科学文献的短信不同,本研究从两个角度进行,正如整个论文所讨论的:科学和工业范围。在科学领域,研究结果表明,推荐系统中研究最多的技术是使用协同过滤器的推荐,其次是使用基于内容的过滤器的推荐。只有14个使用混合推荐系统,而31个使用协同过滤,29个使用基于内容的方法。对于开始使用推荐系统的研究人员来说,这是一个有趣的建议,以找出哪种推荐系统在科学环境中更受欢迎和更常用。通过系统的工业制图进行市场调研发现,提供自动学习解决方案的技术有很多,而且大多是完整的系统或库。然而,由于专有软件不允许这样做,大多数的特性无法被知道。另一个必须强调的重要问题是,不仅自由软件开发人员社区对这个主题感兴趣,而且也有一些大公司出于商业目的在研究它。这清楚地显示了潜在的经济利益,表明它是一个远程研究的分支。

第五文件是“通过计算智能模型驱动工具”促进了复杂事件的定量分析“,G.Víaz,H.Maciá,V.Valero,J.Boubeta-Puig和G. Ortiz。复杂事件处理(CEP)是一种计算智能技术,能够实时分析事件模式识别的大数据流。在本文中,作者说明了通过基于病人的建筑综合征的案例研究来利用Medit4CEP-CPN方法进行复杂事件分析。事件模式已用Medit4CEP-CPN进行图形建模,然后自动转换为事件处理语言(EPL)和彩色Petri网(CPN)代码。此外,CPN工具已用于对本案例研究产生的事件进行定量分析。鉴于Medit4CEP-CPN提供的灵活性,该分析可以应用于其他尖端的实际案例研究,例如电子保健,机器人和移动边缘,以及云计算应用。

MEdit4CEP-CPN的主要优势是其他方法不能提供支持许多功能,例如(1)建模CEP域和事件模式以用户友好的方式通过拖放元素在画布上,(2)语法验证模式,(3)自动转换成CPN模型的图形模式,(4)自动将CPN模型转换为可由CPN工具执行的XML代码,并验证模式语义;(6)通过工具自动生成的CPN Tools可执行模型提供对复杂事件的定量分析。作为未来的工作,作者计划添加额外的特性和功能到MEdit4CEP-CPN,如进一步的EPL操作和新的转换技术。

数据和计算智能是计算机科学领域的突出研究课题,两者结合在一起是当前计算机科学领域的新兴课题之一。我们真诚地希望您喜欢这期特刊。我们也希望论文集作为一个整体能够愉快地向读者介绍计算智能在科学编程领域的复合和具有挑战性的应用领域,从不同的角度提供一些最新的解决方案的新观点。所有被录用的论文都在期刊的范围内,特别是特刊,所有的论文都提供了相关和有趣的研究技术、模型,并直接应用于科学规划领域。在结题之前,我们想对所有向本期特刊投稿的作者和为本期特刊做出贡献的众多审稿人表示衷心的感谢。

利益冲突

编辑声明他们没有潜在的利益冲突。

致谢

编辑致力于承认Ministerio deCongondía(西班牙)(西班牙)(Mineco / Erdf,欧盟)项目,经济和竞争力(西班牙)的协同资金支持(Cosmart Tin2017-83964-R项目),和Consejeríademoledíae emraStucturas / Junta de extremadura(西班牙) - 欧洲区域开发基金(ERDF)(GR18112项目和IB16055项目)。编辑还要感谢审稿人,以便他们提供详细的评论和建议,帮助我们提高了这一特殊问题的质量。

Álvarorubio-largo
胡安•卡洛斯普雷西亚多
Luis Iribarne

参考

  1. 陈志立和陈志勇。数据密集型应用、挑战、技术与技术:大数据调查信息科学, vol. 275, pp. 314-347, 2014。查看在:出版商的网站|谷歌学术
  2. 陈建平,“意见挖掘系统的自然语言处理技术综述”,信息融合,卷。36,pp。10-25,2017。查看在:出版商的网站|谷歌学术
  3. H. Harb,A. Makhoul和C. abou Jaoude,“一种用于密集分布式传感器网络的实时数据处理技术”IEEE访问,卷。6,pp。56551-56561,2018。查看在:出版商的网站|谷歌学术
  4. 曹林,“数据科学:综合概述”,ACM计算调查,卷。50,不。3,pp。1-42,2017。查看在:出版商的网站|谷歌学术
  5. K.Lepenioti,A. Bousdekis,D. Apostolou和G. Mentzas,“规范性分析:文献综述和研究挑战”国际信息管理杂志,卷。50,pp。57-70,2020。查看在:出版商的网站|谷歌学术
  6. A. L'Heureux,K.Groringer,H.F.伊萨曼和M. A. M. Capretz,“机器学习大数据:挑战和方法”IEEE访问, vol. 5, pp. 7776-7797, 2017。查看在:谷歌学术
  7. B. P. L. Lau, S. H. Marakkalage, Y. Zhou等,“智能城市应用中的数据融合研究”,信息融合,第52卷,第357-374页,2019。查看在:出版商的网站|谷歌学术
  8. Y. Jin和B. Hammer,“大数据的计算智能[客人编辑],”IEEE计算智能杂志,第9卷,第5期。3,第12-13页,2014。查看在:出版商的网站|谷歌学术
  9. Z. LV,H.歌曲,P. Basanta-Val,A. Steed和M.Jo,“下一代大数据分析:最先进的,挑战和未来的研究主题”,工业信息学学报,卷。13,不。4,pp.1891-1899,2017。查看在:出版商的网站|谷歌学术

版权所有©2019ÁLVARORUBIO-Largo等。这是分布下的开放式访问文章知识共享署名许可协议,允许在任何媒介上不受限制地使用、传播和复制,但必须正确引用原作。


更多相关文章

PDF. 下载引用 引文
下载其他格式更多的
订单打印副本命令
意见586.
下载499
引用

相关文章

年度奖项:由我们的首席编辑所选的2020年突出的研究捐款。阅读获奖文章