贾特人 《先进的交通工具 2042 - 3195 0197 - 6729 Hindawi 10.1155 / 2021/4439861 4439861 研究文章 匹配运输本体Word2Vec和对齐提取算法 https://orcid.org/0000 - 0002 - 3008 - 8782 Xingsi 1 2 Haolin 1 2 3 https://orcid.org/0000 - 0002 - 1128 - 2141 Yikun 4 Mengting 2 https://orcid.org/0000 - 0002 - 7192 - 226 x 5 Chi-Hua 1 智能信息处理研究中心 福建科技大学 福州 福建350118 中国 fjut.edu.cn 2 计算机科学和数学学院 福建科技大学 福州 福建350118 中国 fjut.edu.cn 3 计算机科学与工程学院 玉林师范大学 玉林 关系537000 中国 ylu.edu.cn 4 福建师范大学协和大学 福州 福建350117 中国 5 网络工程学院 周口师范大学 周口 河南466001年 中国 zknu.edu.cn 2021年 11 5 2021年 2021年 10 4 2021年 4 5 2021年 11 5 2021年 2021年 版权©2021 Xingsi雪等。 这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。

智能交通系统的开发(同期)面临的挑战是,集成来自多个不相关的数据来源。知识集成的核心技术之一,本体通常提供了一个规范的定义交通领域,为信息集成可以用作参考。然而,由于领域专家的主观性,概念可能以多种方式表达,产生本体异构性问题。本体匹配(OM)是一种有效的解决方法,这有助于进一步实现相互间的通信基于本体的同期。在这项工作中,我们首次提出使用Word2Vec在向量空间模型的实体和计算其相似度值。然后,一个稳定的兽奸男童还有对齐提取算法来确定高质量的一致性。在这个实验中,测试方案的性能通过使用基准OAEI真正轨道交通本体。实验结果表明,我们的方法能够获得更高质量的一致性结果比OAEI的参与者和其他先进的本体匹配技术。

福建省自然科学基金 2020年j01875 中国国家自然科学基金 61801527 61103143 福建省13日五年计划2019年教学改革项目 FBJG20190156 第三批福建省重点终身教育项目 ZS20033 福建师范大学 2020 - td - 001 KY20200203
1。介绍

数据在交通领域是复杂多样的 1- - - - - - 3]。这些数据来自不同的数据收集方法等流量传感器,调查,和设备( 4]。因此,智能交通系统的开发(同期)面临的挑战是,集成来自多个不相关的数据来源( 5- - - - - - 7]。这些数据在语义上是不精确的,概念上模棱两可的信息。知识集成的核心技术之一,本体通常提供了一个正式和规范定义的领域知识 8- - - - - - 10]。它们使ITSs基于本体的定义之间的合作领域相关的概念和概念之间的关系( 4]。然而,由于领域专家的主观性,概念的概念可能以多种方式表达( 11, 12]。为了实现相互间的通信基于本体的同期,重要的是要确定异构本体之间的逻辑关系( 13]。本体匹配(OM)是一个重要的技术来解决语义异构的问题( 14, 15),致力于发现相关实体之间的通信(例如,类和属性)在不同的本体( 16]。出于这个原因,有效使用本体匹配技术来解决现有的交通本体语义异构性。

近年来,研究人员已经提出了大量的本体定位策略和开发各种半自动的或自动本体匹配系统( 17- - - - - - 19]。然而,现有的本体匹配方案有许多缺点:匹配器的穷人本体相似度计算,效率低下的提取本体映射的结果,等。为了解决这些弊端,我们首先建议使用Word2Vec [ 20.]在向量空间模型的实体,计算其相似值,使用维基百科训练数据来提高模型的普遍性和一致性的质量。此外,一个稳定的兽奸男童还有本体抽取算法提高定位的质量。

本文的其余内容如下。节 2,我们简要描述的应用本体匹配的交通数据。部分 3详细介绍了本体和本体匹配。节 4,我们使用Word2Vec模型开发本体匹配系统。我们建议Word2Vec-based相似性测量和稳定兽奸男童还有本体部分的提取算法 5 6。节 7,实验结果和分析。最后,结论和未来的工作提供了部分 8

2。相关工作

本体匹配非常适合解决出现的问题从语义模糊性和大数据量的交通数据 21- - - - - - 23]。Benvenuti et al。 24)综合Transmodel本体和KPIOnto促进公共道路监控系统的研究。Transmodel参考数据模型是关于欧洲公共交通信息系统代表交通本体及其关系。贝尔梅霍et al。 25),为了避免使用中央决策点的交通网络,提出了将每辆车作为本体,推理能力。在紧急交通控制,每辆车在拟议的系统是一个决策点,考虑相邻车辆的状态和位置,与他们达成共识。总的来说,本体的发展提供了一个说明性的方法在交通领域知识,可以支持多种方式综合信息。在运输的标准化努力由本体工程方法可以极大地帮助。

最近,技术计算词的相似性和相关性使用Word2Vec模型从word中嵌入已成为一个研究热点,并逐渐应用于本体匹配的域。雪和锅 26]的本体建模的向量空间,然后使用的语言信息实体降低维度,而改进的相似度计算和实体匹配的效率。Zhang et al。 27]介绍了字嵌入技术领域的本体匹配和提出了一个混合的方法,包含词嵌入到元素之间的语义相似度的计算。Teslya和Savosin 28)提出了一个Word2Vec本体映射问题的基于矢量的语言模型。扩展模型的基础上,具体的本体关系。语言是用于匹配的语义本体不考虑单词或具体条款的形式。可以看出,它是可行的使用Word2Vec模型计算语义相似度。至于对齐结果提取,与大量的匹配方法被提出,研究人员通常需要集成多种策略来提高定位的质量。为了更好地提取匹配结果,一个稳定的兽奸男童还有本体提取算法在这工作,进一步提高性能的匹配器。

3所示。本体和本体匹配

本体是一个概念化的规范性描述领域知识(上 29日- - - - - - 31日]。具体来说,本体规范定义了类,属性,其他实体在一个域 32, 33),以及它们之间的关系。图 1显示了本体在一场车祸 34]。在矩形类,例如,“停”,“车”和“保险公司。“空心箭头表示两个类之间的结构关系,例如,“官方机构”的一个子类“保险公司”和“交通事故”的一个子类”事件。“黑色的箭头代表属性,描述两个类之间的关系。然而,相同的实体可以以多种方式构造不同的本体,本体之间的语义异构的问题。

一场车祸本体的一个例子。

为了说明匹配问题,结果两个简单的本体之间的匹配 O O′呈现在图 2。两图中本体的描述类、属性和实例。类显示在矩形。基于结构的关系显示为虚线箭头。在 O,“主席”是一个专门化(子类)”的人。“通讯显示为蓝色双箭头连接类 O类的 O′和描述它们之间的关系。有符号: , (或 ), ,这意味着剥离,更具体(具体或更少),分别和等价关系。举个例子,一个本体的“科目”相当于另一个本体的“主题”,和“普通作者”是一个无关紧要的关系“评论家”。

本体结合的一个例子。

4所示。W2V-OM框架

这项工作构造本体匹配器(W2V-OM)计算两个实体使用Word2Vec模型的相似度值,如图 3。培训Word2Vec模型的数据集是英语维基百科维基百科数据库( 35]。语料库是通用的,可以应付语言处理问题在许多领域。这些文本数据是结构化的,需要预处理成结构化数据。在模型训练后,源交通本体和目标本体解析。实体提取本体被送入word2vec模型来计算余弦相似性和集成linguistic-based相似措施产生相似矩阵。然后,本体映射结果获得使用稳定兽奸男童还有本体抽取算法。最后,本体匹配质量评价是基于参考对齐。

W2V-OM的框架。

5。Word2Vec-Based相似性度量

是一个函数的相似性度量方法两个本体实体的信息作为输入,并使用一个实数之间[0,1]输出代表他们的相似性 36]。具体来说,结果是越接近,就越相似;结果越接近于0,越相似。相似性度量是一个重要的本体匹配过程的一部分。利用不同的相似性度量影响本体一致性的结果。在这项工作中,我们使用两种相似性度量计算的相似度值两个实体,即。,linguistic-based测量和使用Word2Vec余弦相似性度量模型。

Word2Vec是一个语言模型自然语言处理(NLP)单词或短语表示为实数向量。类似的词通常有向量的距离和映射到同一地区,如图 4。关于向量空间的本体表示,这意味着一个类或本体的属性可以表示为向量空间的维度。具体来说,不同的类或属性是独特的向量空间表示。向量空间的覆盖所有本体类和属性。在这个工作中,向量空间的尺寸是由两个本体中所有的类和属性。Word2Vec模型使用维基百科英语语料库训练。每个实体在向量空间表示为一个向量,然后,相似的两个实体使用余弦相似度计算公式。公式定义如下: (1) 余弦相似度 V w 1 , V w 2 = V w 1 V w 2 V w 1 V w 2 , 在哪里 V w 1 V w 2 分别是,向量的两个词 w 1 w 2 V w 1 V w 2 分别表示他们的规范。

单词在向量空间模型。(一)男女。(b)动词时态。(c) Country-Capital。

语言相似性计算两个词之间的语义关系(同义、反义现象),通常使用词典和同义词列表。WordNet [ 37),一个词汇表数据库,构建语义网络基于词语的语义信息,是用来计算相似度。两个词的语言相似 w 1 w 2 是1的时候 w 1 w 2 WordNet是同义词;相似度为0.5时 w 1 w 2 WordNet是上位词;在其他情况下,相似度是0。

两个相似措施产生两个相似矩阵,需要使用一个聚合策略设置不同的矩阵为一个矩阵。在这项工作中,我们实际使用的最大战略整合相似措施,即。,the larger one of two similarity values is selected as the final similarity value, which is of help to ensure the completeness of the alignment.

6。稳定的兽奸男童还有对齐提取

积分的计算结果相似矩阵相似的措施。的th行和 j这个矩阵的列代表的实体 e 如果 e Tj在源本体 O 年代本体和目标 O T,分别。矩阵中的值表示两个实体的相似性。较大的相似性值表明更高的信心等价的两个实体,反之亦然显示更少的信心。在本文中,我们提出一个稳定兽奸男童还有本体提取算法,其中包括一个阈值策略来获得更好的映射的结果。具体步骤如下:(1)所有相似矩阵中的值按降序排序,(2)记录的位置 e 年代 , e T j , j 的最大相似度矩阵, j 最大相似,(3)设置值相同的行和列的 j 为0,(4)重复上述三个步骤,直到所有相似矩阵中的值是0。

5介绍了提取本体映射的结果使用该方法。如图,六个实体通讯终于提取,( e 年代,1, e T, 1(0.95), e 年代,2, e T、2(0.88), e 年代,3, e T, 3(0.6), e 年代,5, e T, 5(0.6), e 年代,6, e T, 5,0.6),( e 年代,4, e T, 40.1)。该算法终止时所有相似矩阵中的值为零,这可能导致提取一些实体相似性较低的通讯。对于映射的结果,这些噪音低的相似之处。因此这项工作包含一个阈值策略。一个阈值参数设置和算法终止时所有相似矩阵中的值都小于阈值。假设一个阈值为0.5,也就是说。,一个年代我米我larity of less than 0.5 is not reliable. Then, the similarity matrix extraction results are ( e 年代,1, e T, 1(0.95), e 年代,2, e T、2(0.88), e 年代,3, e T, 3(0.6), e 年代,5, e T, 5,0.6),( e 年代,6, e T, 50.6)。

对齐提取的一个例子。

7所示。实验 7.1。实验配置

在实验中,我们的建议是使用真实的测试传感器的性能在交通领域本体,以及提供的基准追踪本体一致性评估计划(OAEI)。基准测试库是由参考本体在不同领域。基准轨道中的每个测试用例包含两个本体匹配(目标本体和本体)和一个参考对齐本体匹配器的有效性评价。真正的传感器本体使用OSSN、锡、索萨,SSN。表 1提出了一种基准测试用例的详细描述,并给出传感器本体的简洁介绍表 2。为了评估本体匹配结果的质量,以下是传统的本体一致性度量的定义: (2) r e c 一个 l l = c o r r e c t _ f o u n d _ c o r r e 年代 p o n d e n c e 年代 一个 l l _ p o 年代 年代 b l e _ c o r r e 年代 p o n d e n c e 年代 , p r e c 年代 o n = c o r r e c t _ f o u n d _ c o r r e 年代 p o n d e n c e 年代 一个 l l _ f o u n d _ c o r r e 年代 p o n d e n c e 年代 , f e 一个 年代 u r e = 2 r e 一个 c l l p r e c 年代 o n r e c 一个 l l + p r e c e 年代 o n , 在哪里 p r e c 年代 o n r e c 一个 l l 表示校准结果的准确性和完整性,分别 f e 一个 年代 u r e 调和平均数的吗 p r e c 年代 o n r e c 一个 l l 去平衡它们。

基准测试用例的详细描述。

例ID 案例介绍
101 - 104 两个相同的本体
201 - 210 两个本体与不同语言和词汇特征
221 - 247 两种不同结构的本体
248 - 262 两个本体不同结构、语言和词汇特征

简洁的介绍的传感器本体。

本体的名字 规模 网站
语义本体传感器网络(SSN) 55岁的实体 https://www.w3.org/ns/ssn/
原始语义传感器网络(OSSN)本体 107实体 https://www.w3.org/2005/Incubator/ssn/wiki/SSN传感器
SensorOntology2009 (SN)本体 152实体 https://www.w3.org/2005/Incubator/ssn/wiki/SensorOntology2009
传感器、观察、样本和致动器(索萨)本体 42个实体 https://www.w3.org/ns/sosa/
7.2。比较OAEI的参与者

数据 6- - - - - - 8现在比较OAEI W2V-OM和参与者之间的回忆,精度和f-measure分别。数据,横轴表示测试用例ID,纵轴表示对齐的评价指标,和传说表明不同的匹配系统。如图,W2V-OM高于其他OAEI参与者回忆和F-measure。对精确,我们的方法优于其他参与者在大多数情况下。总之,W2V-OM的性能提出了工作比OAEI的参与者,可以确定高质量的本体对齐。

比较W2V-OM和OAEI参与者的精度。

比较W2V-OM和OAEI参与者回忆。

比较W2V-OM和OAEI F-measure的参与者而言。

7.3。与先进的本体匹配器

关于传感器本体的对齐,四个受欢迎的本体匹配器被用作对比组,基于WordNet相似( 37),相似性的洪水(SF) [ 38[],Jaro-Winkler距离 39],Levenshtein距离( 40]。表 3实验结果显示传感器本体对齐。从实验结果可以看到,W2V-OM优于其他方法在四个真实传感器本体匹配任务,这表明我们的方法的有效性。

比较在W2V-OM和最先进的本体匹配器。

对齐任务 本体一致性指标 WordNet-based匹配器 科幻的匹配器 Jaro-Winkler-based匹配器 Levenshtein-based匹配器 W2V-OM
SOSA-SN 回忆 1.00 0.07 1.00 1.00 1.00
精度 0.33 0.13 0.75 0.75 1.00
f-measure 0.50 1.00 0.86 0.86 1.00

SOSA-OSSN 回忆 1.00 0.50 1.00 1.00 1.00
精度 0.67 0.20 1.00 1.00 1.00
f-measure 0.80 0.29 1.00 1.00 1.00

SSN-OSSN 回忆 0.97 0.35 1.00 1.00 1.00
精度 0.80 0.06 0.94 1.00 1.00
f-measure 0.88 0.11 0.97 1.00 1.00

SSN-SN 回忆 1.00 0.56 1.00 1.00 1.00
精度 0.52 0.02 0.90 1.00 1.00
f-measure 0.70 0.04 0.95 1.00 1.00

由于我们的方法使用Word2Vec本体映射到向量空间,取得相似的计算向量的余弦角两个实体。模型充分考虑了基于字符串的相似度测量和获得高相似性。在映射结果提取过程中,相似度值匹配的实体应该最大的相同的行和列,这意味着这两个实体是最好的定位。匹配器的性能进一步提高保留较大的实体对应相似性值相似矩阵使用稳定的婚姻策略。总之,比较与其他匹配器演示了该方法的有效性。

8。结论和未来的工作

匹配运输本体的目的是确定所有的实体对异构。为此,这项工作首先在向量空间模型实体Word2vec并使用余弦相似性度量来计算两个实体的相似度值。之后,一个稳定的兽奸男童还有对齐提取算法用于确定高质量的一致性。实验结果表明,我们的方法可以获得更高质量的一致性结果相比,先进的本体匹配器和OAEI的参与者。

在未来,我们将采用更先进的相似性措施改善本体相似度的结果。我们也想延长在交通领域本体,本体如道路交通管理和交通事故本体。因为运输本体匹配需要特定的校准和知识背景,需要特定的技术和策略提出提高匹配质量。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

这项工作得到了福建省自然科学基金(没有。2020 j01875),中国国家自然科学基金(61801527和61801527号),福建省13日五年计划2019年教学改革项目(没有。FBJG20190156),第三批福建省重点终身教育项目(没有。ZS20033), 2018年计划在福建大学优秀青年科学研究人员的研究创新团队协和大学福建师范大学2020年(没有。2020 - td - 001),科研项目2020年福建师范大学协和大学(没有。KY20200203)。

Y。 X。 王ydF4y2Ba J。 X。 首歌 H。 Vasilakos 答:V。 探索数据的有效性为智能城市交通系统 IEEE通讯杂志 2017年 55 5 26 33 10.1109 / mcom.2017.1600240 2 - s2.0 - 85019381651 阿里 F。 夸克 D。 P。 运输情绪分析使用字嵌入和基于本体的主题建模 以知识为基础的系统 2019年 174年 27 42 10.1016 / j.knosys.2019.02.033 2 - s2.0 - 85062661528 l f·R。 Y。 大数据分析的智能交通系统:一个调查 IEEE智能交通系统 2018年 20. 1 383年 398年 演员 M。 福克斯 M。 本体为交通研究:一项调查 交通研究部分C:新兴技术 2018年 89年 53 82年 10.1016 / j.trc.2018.01.023 2 - s2.0 - 85044627198 学术界。 F.-J。 H.-Y。 旅行时间预测系统基于数据聚类废物收集车辆 IEICE交易信息和系统 2019年 E102.D 7 1374年 1383年 10.1587 / transinf.2018edp7299 2 - s2.0 - 85069709584 学术界。 公交系统的到达时间预测方法 IEEE物联网 2018年 5 5 4231年 4232年 10.1109 / jiot.2018.2863555 2 - s2.0 - 85051021981 c . H。 首歌 F。 f·J。 l 基于神经网络的一个概率密度函数发生器 自然史答:统计力学及其应用 2020年 541年 1 10 10.1016 / j.physa.2019.123344 学术界。 细胞probe-based车速估计的方法 IEICE交易基础电子、通信和计算机科学 2020年 E103.A 1 265年 267年 10.1587 / transfun.2019tsl0001 C。 X。 一个统一的紧凑遗传算法文献本体匹配 应用智能 2021年 1 16 X。 Y。 基于实例使用NSGA-II本体对齐 信息科学杂志》 2015年 41 1 58 70年 10.1177 / 0165551514550142 2 - s2.0 - 84920830661 j·S。 首歌 p C。 s . C。 y . J。 改善紧凑布谷鸟搜索算法应用于无人机物流中心的位置 数学 2020年 8 3 1 19 10.3390 / math8030333 X。 J。 大规模的生物医学本体匹配与基于核心概念分区算法和自适应紧凑的进化算法 应用软计算 2021年 106年 1 11 10.1016 / j.asoc.2021.107343 H。 Y。 风扇 N。 一个混合深分组大规模全局优化算法 IEEE进化计算 2020年 24 6 1112年 1124年 10.1109 / tevc.2020.2985672 X。 X。 C。 G。 H。 集成传感器本体与全球和局部比对痛苦 无线通信和移动计算 2021年 2021年 10 6625184 10.1155 / 2021/6625184 X。 一个紧凑的萤火虫算法匹配的生物医学本体 知识和信息系统 2020年 62年 1 17 10.1007 / s10115 - 020 - 01443 - 6 X。 C。 C。 优化本体一致性通过链接学习实体对应关系 复杂性 2021年 2021年 12 5574732 10.1155 / 2021/5574732 X。 Y。 使用迷因算法例如指称相同分辨率 IEEE工程知识和数据 2015年 28 2 580年 591年 X。 Y。 优化本体比对通过一个迷因算法使用matchfmeasure和一致的改善比 人工智能 2015年 223年 65年 81年 10.1016 / j.artint.2015.03.001 2 - s2.0 - 84925070644 X。 H。 J。 J。 D。 一个自动的生物医学本体元匹配技术 网络情报杂志 2019年 4 3 109年 113年 教堂 k W。 Word2Vec 自然语言工程 2017年 23 1 155年 162年 10.1017 / s1351324916000334 2 - s2.0 - 85006306812 X。 J。 J。 为优化使用NSGA三世应承担的生物医学本体对齐 CAAI交易情报技术 2019年 4 3 135年 141年 10.1049 / trit.2019.0014 风扇 年代。 Z。 v . C。 j·L。 过程基于本体的方法缓解语义歧义在业务流程建模 数据与知识工程 2016年 102年 57 77年 10.1016 / j.datak.2016.01.001 2 - s2.0 - 84968368130 j . C.-W。 Y。 Djenouri Y。 U。 ASRNN:递归神经网络的注意模型序列标签 以知识为基础的系统 2021年 212年 106548年 10.1016 / j.knosys.2020.106548 Benvenuti F。 Diamantini C。 Potena D。 Storti E。 一个基于本体的框架来支持公共交通系统的性能监控 交通研究部分C:新兴技术 2017年 81年 188年 208年 10.1016 / j.trc.2017.06.001 2 - s2.0 - 85020462087 贝尔梅霍 a·J。 Villadangos J。 Astrain J·J。 科尔多瓦 一个。 基于本体的道路交通管理 智能分布式计算六世 2013年 446年 103年 108年 10.1007 / 978 - 3 - 642 - 32524 - 3 - _14 2 - s2.0 - 84867921330 X。 j·S。 概述基于进化算法的本体匹配 信息隐藏和多媒体信号处理杂志》上 2018年 9 1 75年 88年 Y。 X。 年代。 本体匹配字嵌入 在计算机科学的课堂讲稿 2014年 柏林,德国 施普林格 34 45 10.1007 / 978 - 3 - 319 - 12277 - 9 - _4 Teslya N。 Savosin 年代。 匹配的本体与Word2Vec-based神经网络 计算科学及其Applications-ICCSA 2019 2019年 柏林,德国 施普林格 745年 756年 10.1007 / 978 - 3 - 030 - 24289 - 3 - _55 2 - s2.0 - 85069184246 格鲁伯 t·R。 对本体的设计原则用于知识共享 国际人机研究杂志》上 1995年 43 5 - 6 907年 928年 10.1006 / ijhc.1995.1081 2 - s2.0 - 58149365542 贝拉 G。 Giunchiglia F。 麦克尼尔 F。 语言和领域意识到轻量级本体匹配 网络杂志的语义 2017年 43 1 17 10.1016 / j.websem.2017.03.003 2 - s2.0 - 85018631252 奥臣 P。 Kyanda 年代。 大规模本体匹配 ACM计算调查 2018年 51 4 1 35 10.1145 / 3211871 2 - s2.0 - 85053247442 Otero-Cerdeira l Rodriguez-Martinez f·J。 Gomez-Rodriguez 一个。 本体匹配:一个文献综述 专家系统与应用程序 2015年 42 2 949年 971年 10.1016 / j.eswa.2014.08.032 2 - s2.0 - 84908688792 Shvaiko P。 Euzenat J。 艺术的本体匹配:状态和未来的挑战 IEEE工程知识和数据 2011年 25 1 158年 176年 Barrachina J。 加里多 P。 Fogue M。 VEACON:车辆事故本体旨在提高道路安全 网络和计算机应用》杂志上 2012年 35 6 1891年 1900年 10.1016 / j.jnca.2012.07.013 2 - s2.0 - 84867491387 Denoyer l 加里纳利 P。 维基百科XML语料库 评估国际研讨会的倡议XML检索 2006年 柏林,德国 施普林格 12 19 W。 Farahani m·R。 Aslam 一个。 Hosamani 年代。 远程学习技术本体相似度度量和本体映射 集群计算 2017年 20. 2 959年 968年 10.1007 / s10586 - 017 - 0887 - 3 2 - s2.0 - 85018981575 编辑 C。 WordNet 理论和应用本体:计算机应用 2010年 柏林,德国 施普林格 231年 243年 10.1007 / 978 - 90 - 481 - 8847 - 5 - _10 2 - s2.0 - 84863898480 Melnik 年代。 Garcia-Molina H。 拉姆 E。 相似的洪水:通用的图匹配算法及其应用模式匹配 18国际会议数据工程的程序 2002年2月 美国加利福尼亚州圣何塞 117年 128年 科恩 W·W。 Ravikumar P。 Fienberg s E。 比较字符串名字匹配任务的距离度量 IIWeb 2013年 3 73年 78年 Levenshtein 诉我。 二进制编码能够纠正删除、插入和逆转 苏联物理学Doklady 1966年 10 8 707年 710年