大数据技术旨在解决三对大数据的挑战,包括体积(大量的数据),各种(一系列的数据类型和来源)速度(数据进出的速度)。大数据通常是捕获没有特定的目的,导致大部分被task-irrelevant数据。数据最重要的特点是体积和其他Vs,但它的价值。而大数据的技术基础是数据驱动的业务决策、智能数据语义编译一个有组织的方式,操作关联,分析不同的数据源。

处理体积语义技术促进更好的决策通过将大量的数据转换为抽象,含义,和见解。神经网络算法为深度学习和利用整个提供优势,而不是部分的数据。这篇文章“一个新的数据表示基于训练数据特征提取药物名称的实体在医学文本”通过m . Sadikin等人提出了三个数据表示技术分析词分布和相似性的特点由于word-embedding培训。这些技术包括多层感知器,deep-network分类器(深层信念网络,堆叠去噪编码器),短期和长期记忆。在这篇文章中“对象分类上优于视觉显著模型和卷积神经网络”通过n .李et al。neuroscience-inspired分类方法提出了模拟人类视觉信息处理机制。该方法结合视觉注意力模型和卷积神经网络来提高分类的准确性对象,特别是生物学。美国Bi等人提出一个指定方法使用断裂力学模型嵌入在文章中学习单词“断裂力学方法嵌入代神经概率语言模型。”方法旨在提高准确性,记得,传统的语言和文本可视化模型,嵌入和一个词,语义向量表示,可能是通过神经语言学模型生成。

各种,集成异构数据源需要有效的方法提供定义良好的本体和自然语言处理。在这篇文章中基于“一个人物等级和文字水平Chinese-Vietnamese机器翻译方法”通过p Tran et al .,混合翻译方法提出了一个自然语言到另一个(例如,从中国到越南)相结合的优势在乐此不疲的和基于规则的翻译方法在字符和单词的水平。这种方法除了使用双语语料库,利用统计机器翻译的翻译和word-reordering功能和规则的翻译的准确性。在本文的方法“N-Gram-Based文本压缩”由v . h .阮等人提出了一种有效的方法压缩文本(越南)通过使用 蟋蟀字典。这种方法提高了压缩比和压缩和解压缩时间与其他方法相比。

解决速度本体演化技术支持动态、灵活和自适应创建新对象的模型,概念和关系和使用它们更好地理解新线索捕获的数据快速发展的事件和情况。这篇文章“社交媒体满足大型城市数据:一个案例研究的城市洪涝灾害分析”通过n张等人提出了一个transfer-learning方法来分析城市洪涝灾害交通运营管理。它使用社交媒体和卫星数据;严重程度之间的相关性,分析道路网络、地形、降水;并采用多视图判别transfer-learning方法转移知识城市之间,有效应用在一些城市在中国和印度。这篇文章“自动Multisentiment词典”的建设和全局优化通过x杨等人提出了一种自动构造和全局优化框架multisentiment词典基于约束的坐标偏移量。方法执行统计培训一个大型语料库使用神经网络模型,实现了一个情绪消歧算法(基于词分布密度在不同的上下文中区分情绪极性),并进一步整合各种human-annotated资源优化的十维情绪词汇学习。

提出了不同的方法来解决不同的问题在各个领域。他们的目标是准确的,可操作的,和敏捷聪明的决策。智能数据利用3 v-challenges和采用语义数据提取和神经科学价值,会议的大数据和语义。

阮富仲h . Duong
香港问:阮
Geun美国乔