处理、采矿和学习复杂的数据指的是一种先进的数据挖掘和知识发现的研究区域有关的开发和分析方法发现模式和学习模式与一个复杂的数据结构(例如,multirelational数据、XML数据、文本数据、图像数据、时间序列,序列图、流媒体数据,和树木)(1- - - - - -5]。这些类型的数据是常见的在许多社会、经济、科学和工程应用。复杂的数据给目前的研究提出了新的挑战在数据挖掘和知识发现他们需要新方法处理,挖掘和学习。传统的数据分析方法往往需要数据表示为向量(6]。然而,许多数据对象在实际应用程序中,如化合物在生物制药,大脑区域在大脑健康数据,用户在业务网络,和在医疗数据时间序列信息,包含丰富的结构信息(例如,数据和时间结构之间的关系)。这样一个简单的特征向量表示本身失去了物体的结构信息。在现实中,对象可能有复杂的特点,根据评估的对象和特征。与此同时,数据可能来自异构域(7),如传统tabular-based数据、序列模式,图表,时间序列信息,和一种数据。新的数据分析方法所需的发现有意义的知识在先进的应用程序从数据对象复杂的特点。这个特殊的问题导致处理的基础研究,挖掘和学习复杂的数据,重点分析复杂的数据来源。
1。空间数据
随着移动通信技术的发展,基于位置的服务是蓬勃发展的路旁。与此同时,隐私保护已成为服务的进一步发展的主要障碍。本文题为“有效保护隐私协议神经网络搜索加密的数据定位服务”提出了一个高效的私人循环查询协议与高准确率和低计算和通信成本。摩尔曲线采用二维空间数据转换成一维序列和加密的兴趣点(POIs)信息与隐私保护的Brakerski-Gentry-Vaikuntanathan同态加密方案。加密的方案执行秘密循环变化POI信息隐藏的位置用户没有可信第三方。该方案提供了高精度查询结果,同时保持低计算和通信成本。
2。Web服务器数据
这篇题为“深复发模型的服务器负载和性能预测数据中心”建议使用深度学习预测web服务器的性能和工作负载。模型可以自动提取特征在学习过程中没有任何先验知识或hand-generated特性分割。真正的web服务器上的实验数据表明,该模型可以实现良好的性能和泛化预测不同类型的服务器的性能。结果还表明,我们的模型生成的负载非常类似于真实的一个,可应用于测试数据中心和其他类型的服务器。大多数数据中心的服务器日志系统。只要操作的日志文件记录的用户,该方法可用于生成服务器的负载和预测服务器性能在不同的负载条件下。
3所示。图像数据
篇题为“无人监督的领域适应用Exemplar-SVMs适应正规化”提出了一个有效的方法领域适应问题与正则化项,减少了数据分布不匹配域和保留了原始数据的属性。此外,利用集成分类器的方法可以预测目标域数据精度高。该方法主要目的是预测在跨域或实例设置存在分布不匹配,达到想要的结果。在学习数据传输知识转移的实验图像,图像。
高光谱成像技术被证明是一种有效的方法来探索土地对象背后的有用的信息。,也可以采用生物信息提取,来源的信息可以从图像获得多次没有污染。论文题为“基于自主学习背景信息的高光谱目标探测”提出了一种基于背景目标探测方法自学从高光谱图像中提取生物信息。传统的非结构化目标检测器很难估计背景统计准确在全球和当地的方式。考虑到空间光谱信息,其性能可以进一步提高避免上述问题。特别设计用于从高光谱生物图像提取指纹和肿瘤区域。方法的有效性和优越性已经演示了从高光谱图像检测生物信息。
分割前列腺癌的磁共振成像在前列腺癌诊断中起着重要的作用。然而,缺乏明确的边界和前列腺癌的重要变化的形状和外表的自动分割非常具有挑战性。在过去的几年中,方法基于深度学习在前列腺分割技术取得了重大进展。然而,这些方法主要注重功能和上下文在每个单片3 d体积。因此,这些方法面临着许多困难当分段的顶端和基部前列腺由于有限的边界信息。为了解决这个问题,本文题为“剥削片间相关性对前列腺癌MRI图像分割:从“递归神经网络方面与双向卷积神经网络提出了一种深复发层前列腺图像分割的磁共振成像。除了利用intraslice上下文和特性,该模型也对前列腺切片数据序列和利用interslice上下文帮助细分。该方法取得显著地提高分割相比其他报道的方法。
早期发现Lobesia botrana一个适当的控制是一个主要问题的昆虫视为小道消息的主要害虫。本文题为“分布式——适用于分割算法Lobesia botrana识别”提出了一种新颖的方法l . botrana识别与描述符使用基于聚类分割的图像数据挖掘考虑灰度值和梯度在每一段。这个系统允许的95%l . botrana识别在nonfully控制照明、放大和取向的环境。图像捕捉应用程序目前实现在移动应用程序中,以及随后在云中分割处理。
这篇题为“深层次化表示从分类Logo405”引入了一个标志分类机制相结合的一系列深表示通过微调卷积神经网络体系结构和传统的模式识别算法。这些实验是进行标志- 405数据集和公开FlickrLogos-32图像数据集。实验结果表明,该机制优于两种流行的方法用于标识分类,包括战略,整合手工特性和传统的模式识别算法和模型。
篇题为“内核负面的ε拖动线性回归模式分类”提出了一个内核负面ε拖动线性回归模式分类方法,同时综合负的ε拖动技术和内核方法为强劲的线性回归模式分类条件下之间的一致性和兼容性测试样本和训练样本是可怜的。消极的ε拖动技术学习分类器与一个合适的利润率从背景噪声和变形数据。与此同时,内核方法可以使线性不可分的样本变得线性可分的。基于负面的影响ε拖动技术协作和内核,背景噪声的方法可以更好地完成分类和变形数据。全面的24对图像数据集演示算法性能实验。
最近,红外人体动作识别吸引了越来越多的关注,它有许多优于可见光,也就是说,健壮的光照变化和阴影。然而,红外动作数据是有限的,直到现在,这削弱了红外动作识别的性能。出于转移学习的想法,一个红外人体动作识别框架使用辅助数据从可见光提出解决问题篇题为“红外行动数据有限的转移特性表示Visible-to-Infrared Cross-Dataset人类行为的认可。“InfAR评估方法,这是一个公开的红外数据集人类行为。建立辅助数据,我们建立了一个新的数据集XD145可见光行动。实验结果表明,该方法可以获得先进的性能与几个转移学习和域适应方法。
4所示。社会网络数据
社会影响分析是很重要的对于许多社交网络应用程序,包括建议和网络安全分析。社区的影响包括多个用户超过个人影响力。现有模型关注个体的影响分析,而很少有研究估计在在线社交网络社区的影响无处不在。一个重大的挑战在于,研究人员需要考虑很多因素,比如用户的影响,社会信任,和用户的关系,模型社区的影响。这篇题为“挖掘微博网络中社区的影响:一个案例研究在新浪微博上“旨在评估社区影响有效和准确;问题是制定作为建模社区影响力和构造一个社区影响分析模型。实证研究在一个真实的数据集从新浪微博证明该模型的优越性。
在分布式的云环境中,云平台往往不愿意分享其记录用户服务调用数据与其他云平台由于隐私问题,这降低了云间协作服务的可行性建议。此外,用户服务调用每个云平台可能更新记录的数据随着时间的推移,这大大降低了推荐的可伸缩性。针对这两个挑战,一种新型保护隐私和可伸缩基于SimHash服务推荐方法,也就是说,SerRecSimHash,提出了名为“保护隐私和可伸缩的服务推荐基于SimHash在分布式云环境。“一组实验进行WS-DREAM基于一个真正的分布式服务质量数据集。实验结果表明,SerRecSimHash优于其他最新方法的推荐精度和效率,同时保证隐私保护。
5。时间序列数据/信号
复杂系统是一个宽泛的概念,包含许多学科,包括工程系统。不管他们的特定行为,复杂的系统相似的行为,比如同步。这篇题为“确定耦合振子的一组实验数据来源”提出了不同的技术来确定当一组耦合振子同步的来源。可以确定的位置和时间变化的耦合通过应用分析技术的结合,即同步的来源。为此,实验数据的分析提出了一个复杂的机械系统。实验包括放置24-bladed转子在一个气流。叶片的振动运动的加速度记录,和由此产生的信息进行了分析和四个技术:相关系数,Kuramoto参数,互相关函数和递归图。频率的测量数据清楚地表明存在由于前台组件和它们之间的内部相互作用由于背景组件(耦合)。
确认
客人编辑团队想表达他们的感谢所有作者的兴趣选择这个特殊的问题作为他们的学术工作地点传播。编辑也要感谢匿名评论者的仔细阅读手稿提交这个特殊问题的收集和许多有见地的意见和建议。
吴贾
Shirui锅
川周
李刚
吴他
撑起张