研究文章|
Rasim m . Alguliev拉米兹m . Aliguliyev成吉思汗Mehdiyev
pSum-SaDE:修改<我>p中值问题和自适应差分进化算法用于文本摘要
Rasim m . Alguliev
1年代up><年代p一个n>信息技术学院的阿塞拜疆国家科学院b Vahabzade街9日AZ1141巴库,阿塞拜疆年代p一个n>
文摘
gydF4y2Ba萃取multidocument总结建模为修改<我>p中值问题。问题是制定考虑四个基本要求,即相关性、信息报道、多样性、和长度限制,应该满足摘要。解决优化问题的自适应差分进化算法。微分进化已经被证明是一种有效的和健壮的算法对于许多实际的优化问题。然而,它仍然可能收敛到局部最优的解决方案,需要手动调整参数,并寻找最佳控制参数的值是一个消费的任务。在论文中提出了一个自适应比例因子在原始增加勘探和开发能力。本文发现,自适应差分进化可以有效地找到最好的解决方案相比,规范化微分进化。我们实现了我们的模型在多文档摘要任务。实验表明,该模型在DUC2006数据集具有竞争力。
<年代p一个ncl一个年代年代="end-abs">1。介绍
gydF4y2Ba自动文档总结过去吸引了越来越多的关注与互联网的快速发展和电子政府。电子文档的爆炸导致信息过载,这意味着寻找,并高效地使用信息已成为一个紧迫的现实问题。可以减少信息过载的文本摘要与传统搜索引擎有效访问检索文档的相关性。文档自动摘要的目的是压缩原始文本到其本质内容和协助筛选和选择必要的信息(<一个href=”#B1">1一个>]。
gydF4y2Ba根据文档的数量是总结,总结可以一个文档或multidocument。单文档摘要只能压缩一个文件成较短的表示,而multidocument总结可以凝结一组文档总结。Multidocument总结可以被看作是一个扩展的单文档总结,用于精确描述中包含的信息的文件,方便用户理解文档的集群。因为它结合和集成的信息文件,它执行合成和知识发现和知识可以用于知识获取(<一个href=”#B2">2一个>]。
gydF4y2Ba文档总结的有两种方法:监督和非监督<一个href=”#B3">3一个>]。监督方法治疗文档摘要作为分类和任务形式化确定是否应包含在一个句子总结。然而,他们需要训练样本。无监督的方法通常利用聚类算法文档中的句子得分结合一组预定义的功能(<一个href=”#B4">4一个>- - - - - -- - - - - -- - - - - -- - - - - -- - - - - -- - - - - -
gydF4y2Ba摘要任务也可以分为通用面向或查询。面向总结介绍了给定查询的更相关的信息,而一个通用总结给出了一个整体意义上的文档的内容(<一个href=”#B7">7一个>,
gydF4y2Ba在本文中,我们专注于无监督通用文本摘要,它生成一个摘要提取突出句子在给定文档(年代)。我们代表通用文本摘要修改<我>p中值问题。这种方法的优点之一是,它直接发现关键句子给出收集和覆盖原始来源的主要内容。我们的模型的另一个优点是,它可以减少冗余的总结。在这篇文章中,创建一个自适应差分进化(DE)算法来解决优化问题。建议的方法的性能测试DUC2006数据集,与基线相比系统。演示了该方法的有效性。
gydF4y2Ba本文的其余部分组织如下。部分<一个href=”#sec2">2一个>简要回顾相关工作。制定对文本的句子选择问题总结介绍了部分<一个href=”#sec3">3一个>。部分<一个href=”#sec4">4一个>描述了一个修改DE算法解决优化问题。数值实验和结果部分<一个href=”#sec5">5一个>。最后,我们得出我们的论文<一个href=”#sec6">6一个>。
gydF4y2Ba一般来说,文档摘要的方法可以分为两类:抽象和萃取<一个href=”#B4">4一个>,
gydF4y2Ba许多方法已经提出了基于多样性文档摘要。先锋工作diversity-based文档摘要MMR(最大边际相关性);它是由Carbonell和戈尔茨坦(介绍<一个href=”#B11">11一个>]。MMR总结文档方法通过计算给定的查询和文档之间的余弦相似性和当前选择的句子之间的余弦相似性和先前选择的句子。MMI(最大边际的重要性)<一个href=”#B12">12一个>)也是一个diversity-based文本摘要方法总结的一代。这取决于提取最重要的句子从原始文本。大多数特性(即。,年代entencecentr一个lity; title feature; word sentence score; keyword feature; similarity to first sentence) used in this method are combined in a linear combination to show the importance of the sentence. CollabSum [<一个href=”#B13">13一个>)减少冗余已经通过丢弃高度重叠的句子提取高排名的句子。
gydF4y2Ba集群已成为越来越重要的话题与爆炸的信息通过互联网和电子政府服务。这是一个重要的工具在文本挖掘和知识发现。它能够自动相似的文本对象归类到一起使发现隐藏的相似性和一个关键的概念,以及总结大量的文本分成一小部分组(<一个href=”#B14">14一个>]。在[<一个href=”#B15">15一个>),集群作为一种有效的工具之间的多样性的句子。这项工作首先集群的句子和句子使用了集群生成一个摘要。摘要(<一个href=”#B16">16一个>)提出了一种基于查询multidocument总结方法,使用NNM语义特征和聚类方法。作品(<一个href=”#B17">17一个>- - - - - -- - - - - -- - - - - -- - - - - -- - - - - -- - - - - -
gydF4y2Ba欧阳et al。<一个href=”#B21">21一个>]应用机器学习方法基于主题的总结了关于句子得分作为回归问题。回归函数从支持向量回归(SVR)模型,即回归型支持向量机(SVM)和具有建造技术发展水平的最优近似函数。它提供了一种自动、有效地结合特性。节省昂贵的手工注释的时间和精力,他们从文档集构造训练数据自动生成的参考总结人类提供了。摘要(<一个href=”#B22">22一个>调查multi-topic-based面向问题的总结。这项工作的主要任务和形式化的作者提出了概率方法来解决的任务。他们研究两种策略同时建模文档内容和查询信息和现在的四种方法得分句子根据学习主题的文档模型。HierSum [<一个href=”#B23">23一个>)是一种基于主题模型的生成摘要方法,它使用的句子作为一个额外的水平。使用一个近似推理,句子是贪婪地添加到总结只要他们减少Kullback-Leibler散度。排名中扮演一个重要的角色在信息检索和自然语言处理应用程序。工作的主要贡献(<一个href=”#B24">24一个>有三重):(1)提出了一种“rank-learn-combine”无监督ensemble-ranking框架,即交互式排名(iRANK);(2)探索两个排名优化策略,利用反馈作为额外的排名功能或确保排名一致性在细化;(3)提出了两种新的sentence-ranking算法基于iRANK query-focused汇总。一种方法,提出了在<一个href=”#B25">25一个>),生产总结由三个步骤组成。首先,它将句子和查询与代表的潜在主题空间向量模型估算他们的混合比例。然后一些字面意思特性计算句子相似度的基础上和查询分布在潜在的主题。最后,它将个人特征分数线性组合成一个整体句子评分来创建一个排名,我们使用选择的句子总结。混合分层的史书,HybHSum [<一个href=”#B26">26一个>),是基于混合学习方法提取句子生成摘要。它发现隐藏的句子在给定文档的主题分布基于分层集群以及提供摘要句子潜在狄利克雷分配(LDA),这是一个泛化的LDA。贡献的工作如下:(1)建设层次概率模型旨在发现所有句子的主题结构;(2)表示句子metafeatures描述他们的候选人列入总结文本;(3)实现一个可行的基于回归模型的推理方法,使句子在测试文档的得分集群没有再培训。
gydF4y2Ba的出版工作(<一个href=”#B27">27一个>),一种优化方法开始应用积极萃取文档摘要。它直接与性格的采掘总结;换句话说,在文档中识别有用的句子的自然是一个优化问题。Takamura和时候<一个href=”#B28">28一个>)代表文本摘要背包约束最大覆盖问题。麦当劳(<一个href=”#B29">29日一个>)正式文本摘要背包问题并获得全球解决方案及其近似解。王等人。<一个href=”#B30">30.一个>)提出了一种贝叶斯的填空题型可以主题模型(BSTM) multidocument总结利用word文档和word-sentence关联。BSTM模型的概率分布选择句子给出主题和总结任务提供了一个有原则的方式。道等。<一个href=”#B31">31日一个>)设计了基于单词填空题型可以协会网络和提出的词和句子权重方法基于他们包含多少信息共存并应用于文本摘要。在[<一个href=”#B32">32一个>),文本摘要正式的预算值的问题。这个模型覆盖整个文档集群通过句子的任务,因为在这个模型的一个选中的句子尽可能代表每个句子。该方法的一个优势是,它可以将不对称的句子以自然的方式之间的关系。黄等。<一个href=”#B33">33一个>)考虑文档总结作为一个多目标优化问题。特别是,他们制定四个目标函数,即内容覆盖面、相关性、冗余和文本连贯性。他们衡量可能的总结的基础上,确定了核心条款和主题(即。集群的语义或统计相关核心条款)。
3所示。问题描述及数学公式
gydF4y2Ba在本节中,我们提出我们的方法的所有四个方面总结如下。<年代p一个ncl一个年代年代=”l我年代t”>(1)年代p一个n><年代p一个ncl一个年代s="list-content">相关性我>。一个好的总结应包含最重要的信息,那就是,选择相关的句子应该源的主要内容。年代p一个n>年代p一个n>(2)年代p一个n><年代p一个ncl一个年代s="list-content">内容覆盖我>。摘要应包含文档的每一个重要的方面。通过考虑保险,损失的信息总结可以最小化。年代p一个n>年代p一个n>(3)年代p一个n><年代p一个ncl一个年代s="list-content">多样性我>。一个好的总结应该简洁,包含尽可能少的冗余的句子,也就是说,两个句子提供类似的信息都不应该出现在总结。在实践中,实施多元化的总结中可以有效地减少冗余的句子。年代p一个n>年代p一个n>(4)年代p一个n><年代p一个ncl一个年代s="list-content">长度我>。摘要的长度应该是有界的。年代p一个n>年代p一个n>
联合优化这四个属性是一项具挑战性的工作,是一个全球问题总结。这就是为什么包含相关的句子不仅依赖于句子本身的性质,但也在其他句子的性质总结(<一个href=”#B33">33一个>]。我们的目标是选择一组文件的一个子集的句子,这样创建的总结已经满足以上四个方面。在我们的研究中,这一目标已达成的修改<我>p中值问题。
gydF4y2Ba应用<我>p中值问题sentence-extraction-based文档总结,每个句子在文档集合应该视为欧几里得空间中的一个点,定义一个度量来计算之间的相似点(句子)。
gydF4y2Ba让一个文档集合分解为一组句子<年代vg height="14.75" id="M1" style="vertical-align:-3.20526pt;width:123.5125px;" version="1.1" viewbox="0 0 123.5125 14.75" width="123.5125" xmlns="http://www.w3.org/2000/svg">
<年代p一个ncl一个年代s="statement" id="head1">向量空间模型我>年代p一个n>
标准向量空间模型(以下简称VSM)是一个代表文本向量空间模型基于包的单词的方法。它第一次被提出作为信息检索(IR)的模型在<一个href=”#B34">34一个>]。在扫描仪,文本语料库的单位是由向量表示。传统上整个文档作为一个文本单元,但是其他任何文本单元可以使用段落或句子。每个维度的一个向量对应语料库中出现的一个术语。一个术语,例如,一个词,语法,或者一个短语。如果一个词出现在一个句子中,该维度的值是零。值可以是二进制(<年代vg height="10.6875" id="M8" style="vertical-align:-0.0pt;width:31.9625px;" version="1.1" viewbox="0 0 31.9625 10.6875" width="31.9625" xmlns="http://www.w3.org/2000/svg">
术语权重我>年代p一个n>
背后的想法术语权重分配一个体重代表一个术语的重要性。一个术语的原始频率只有州词在文档中出现的频率没有测量的重要性这个词在句子或在整个集合。不同的加权方案可供选择。最常见的和最受欢迎的是tf-isf加权方案。它结合了局部和全局权重的一个术语。年代p一个n>
本地术语权重(<年代vg height="10.95" id="M10" style="vertical-align:-0.12538pt;width:9.6750002px;" version="1.1" viewbox="0 0 9.6750002 10.95" width="9.6750002" xmlns="http://www.w3.org/2000/svg">
它衡量一个术语的重要性在一个句子:<年代p一个ncl一个年代年代=”e问u一个t我on" id="EEq1">
在哪里<年代vg height="14.8625" id="M12" style="vertical-align:-3.25662pt;width:35.212502px;" version="1.1" viewbox="0 0 35.212502 14.8625" width="35.212502" xmlns="http://www.w3.org/2000/svg">
全球术语权重(<年代vg height="10.95" id="M15" style="vertical-align:-0.12538pt;width:15.75px;" version="1.1" viewbox="0 0 15.75 10.95" width="15.75" xmlns="http://www.w3.org/2000/svg">
逆句子频率(安全部队)措施的重要性,一个词在句子集合:<年代p一个ncl一个年代年代=”e问u一个t我on" id="EEq2">
在这里<年代vg height="7.1374998" id="M17" style="vertical-align:-0.10033pt;width:7.8874998px;" version="1.1" viewbox="0 0 7.8874998 7.1374998" width="7.8874998" xmlns="http://www.w3.org/2000/svg">
gydF4y2Ba这导致tf-isf加权方案:<年代p一个ncl一个年代年代=”e问u一个t我on" id="EEq3">
的重量<年代vg height="11.3375" id="M22" style="vertical-align:-3.2316pt;width:22.1875px;" version="1.1" viewbox="0 0 22.1875 11.3375" width="22.1875" xmlns="http://www.w3.org/2000/svg">
相似度计算我>年代p一个n>
一个非常流行的相似性度量是余弦相似性。余弦相似度使用加权的术语表示句子。根据句子的特点<年代vg height="11.05" id="M28" style="vertical-align:-3.2316pt;width:11.025px;" version="1.1" viewbox="0 0 11.025 11.05" width="11.025" xmlns="http://www.w3.org/2000/svg">
这个州的两个向量的乘积等于产品的规范(在空间方面,向量的长度)乘以角的余弦值<年代vg height="7.1750002" id="M37" style="vertical-align:-0.1254pt;width:8.9375px;" version="1.1" viewbox="0 0 8.9375 7.1750002" width="8.9375" xmlns="http://www.w3.org/2000/svg">
3.3。数学公式的问题
gydF4y2Ba首先,我们介绍以下变量和符号:<年代p一个ncl一个年代年代=”l我年代t”>(我)年代p一个n><年代p一个ncl一个年代s="list-content">
(2)年代p一个n><年代p一个ncl一个年代s="list-content">
(3)年代p一个n><年代p一个ncl一个年代s="list-content">
是集合的中心<年代vg height="14.75" id="M42" style="vertical-align:-3.20526pt;width:123.5125px;" version="1.1" viewbox="0 0 123.5125 14.75" width="123.5125" xmlns="http://www.w3.org/2000/svg">
我们试图找到集的一个子集<年代vg height="14.75" id="M49" style="vertical-align:-3.20526pt;width:123.5125px;" version="1.1" viewbox="0 0 123.5125 14.75" width="123.5125" xmlns="http://www.w3.org/2000/svg">
gydF4y2Ba在上面的符号和语句中,文本摘要任务,我们形式化如下:
gydF4y2Ba最大化<年代p一个ncl一个年代年代=”e问u一个t我on" id="EEq6">
受<年代p一个ncl一个年代年代=”e问u一个t我on" id="EEq7">
在哪里<年代vg height="18.6" id="M60" style="vertical-align:-5.94002pt;width:86.375px;" version="1.1" viewbox="0 0 86.375 18.6" width="86.375" xmlns="http://www.w3.org/2000/svg">
gydF4y2Ba目标函数(<一个href=”#EEq6">9一个>)平衡相关性、内容覆盖面和多样性的总结。第一项旨在评估总结的相关性。高价值的项对应于高相关性的总结。第二项旨在评估总结的内容覆盖。的术语提供了高价值的句子被分组在主题。正如上面说的总结不应该包含多个句子传达同样的信息。以后,在我们的配方,据推测总结形成的中位数在选择的句子作为值,必须满足一个条件,它们之间的相似性是最低。这个要求将提供的第三个任期。低价值的术语对应更高的多样性的总结。约束(<一个href=”#EEq7">10一个>)确保每个句子都应该有一个且只有一个值,而约束(<一个href=”#EEq7">11一个>)限制句子被分配到开放的中位数。约束(<一个href=”#EEq7">12一个>)意味着摘要的长度约束不能被侵犯。最后,约束(<一个href=”#EEq7">13一个>)和(<一个href=”#EEq7">14一个>)引用完整性约束。
gydF4y2Ba看到,这三个术语的范围(<一个href=”#EEq6">9一个>)是非常不同的。例如,第一项的范围<年代vg height="13.125" id="M62" style="vertical-align:-1.95624pt;width:32.674999px;" version="1.1" viewbox="0 0 32.674999 13.125" width="32.674999" xmlns="http://www.w3.org/2000/svg">
现在,我们的目标是找到二进制作业<年代vg height="16.637501" id="M68" style="vertical-align:-4.77652pt;width:54.487499px;" version="1.1" viewbox="0 0 54.487499 16.637501" width="54.487499" xmlns="http://www.w3.org/2000/svg">
gydF4y2Ba德提出的Storn和价格(<一个href=”#B37">37一个>)是一个快速和简单的技术,它表现在各种各样的问题(<一个href=”#B38">38一个>- - - - - -- - - - - -- - - - - -- - - - - -- - - - - -- - - - - -
gydF4y2Ba德计划的基本思想是基于矢量生成新的试验。实现突变时,几个微分向量获得一些随机选择的参数向量的区别被添加到目标向量来生成一个变异向量。然后,试验向量是由交叉重组获得的突变体向量与目标向量。最后,如果试验向量收益率比目标向量,更好的健身价值目标向量替换试验向量(<一个href=”#B37">37一个>- - - - - -- - - - - -- - - - - -- - - - - -- - - - - -- - - - - -
gydF4y2Ba在本节中,创建一个自适应德(萨德)算法解决优化问题(<一个href=”#eq4"> )- (<一个href=”#EEq7">14一个>)。萨德算法的主要步骤如下所述。
gydF4y2Ba一个德搜索全局最优点<年代vg height="7.1374998" id="M72" style="vertical-align:-0.10033pt;width:7.8874998px;" version="1.1" viewbox="0 0 7.8874998 7.1374998" width="7.8874998" xmlns="http://www.w3.org/2000/svg">
gydF4y2Ba对于每个参数的问题,可能会有某个范围内的参数的值应该被限制,常常因为参数相关的物理组件或自然界限的措施。初始种群(<年代vg height="10.9125" id="M83" style="vertical-align:-0.17555pt;width:32.224998px;" version="1.1" viewbox="0 0 32.224998 10.9125" width="32.224998" xmlns="http://www.w3.org/2000/svg">
gydF4y2Ba初始化后,德采用变异操作产生变异向量关于每个单独的,所谓的目标向量,在目前的一代。为每个目标向量,<年代vg height="16.6" id="M94" style="vertical-align:-4.74141pt;width:33.75px;" version="1.1" viewbox="0 0 33.75 16.6" width="33.75" xmlns="http://www.w3.org/2000/svg">
gydF4y2Ba比例因子<年代vg height="10.325" id="M107" style="vertical-align:-0.0pt;width:12.05px;" version="1.1" viewbox="0 0 12.05 10.325" width="12.05" xmlns="http://www.w3.org/2000/svg">
gydF4y2Ba出于什么是前面提到的在这一节中,比例因子是动态地适应每一个人通过引入所谓的亲和指数,衡量特征密切的个人解决个人全球人口的解决方案<年代vg height="9.125" id="M109" style="vertical-align:-0.11285pt;width:5.0124998px;" version="1.1" viewbox="0 0 5.0124998 9.125" width="5.0124998" xmlns="http://www.w3.org/2000/svg">
计算的比例因子<年代vg height="9.875" id="M111" style="vertical-align:-2.29482pt;width:7.7624998px;" version="1.1" viewbox="0 0 7.7624998 9.875" width="7.7624998" xmlns="http://www.w3.org/2000/svg">
gydF4y2Ba可以得出结论,一个小<年代vg height="16.6" id="M122" style="vertical-align:-4.74141pt;width:37.887501px;" version="1.1" viewbox="0 0 37.887501 16.6" width="37.887501" xmlns="http://www.w3.org/2000/svg">
根据上面的假设和定义,可以得出<年代vg height="16.7875" id="M130" style="vertical-align:-4.74141pt;width:97.1875px;" version="1.1" viewbox="0 0 97.1875 16.7875" width="97.1875" xmlns="http://www.w3.org/2000/svg">
|
||||||||||||||||||||||||||||||||||||||||||||||||
从报告的结果表<一个href=”http年代://www.newsama.com/journals/acisc/2011/351498/tab1/" target="_blank">1一个>,我们有以下的观察:(1)pSum-SaDE方法优于其他方法,其结果是接近结果的方法PLSA-JS;(2)HierSum最糟糕的表现;LEX和iRANK(3)的结果是相似的。
gydF4y2Ba表<一个href=”http年代://www.newsama.com/journals/acisc/2011/351498/tab2/" target="_blank">2一个>证明了改进方法的pSum-SaDE胭脂分数。我们清楚地观察到我们的方法达到最高的胭脂分数和优于所有其他系统。相比之下我们使用相对提高<年代vg height="13.5625" id="M230" style="vertical-align:-2.21957pt;width:336.79999px;" version="1.1" viewbox="0 0 336.79999 13.5625" width="336.79999" xmlns="http://www.w3.org/2000/svg">
|
|||||||||||||||||||||||||||||||||||||||||||||||||||
我们进一步将我们的结果与最好的三个参与者系统(<一个href=”#B22">22一个>在2006年DUC]。表<一个href=”http年代://www.newsama.com/journals/acisc/2011/351498/tab3/" target="_blank">3一个>给出了比较结果。我们看到,我们提出的方法优于三个系统。我们需要注意,我们的方法不使用任何外部信息,同时系统通常(严重)取决于一些外部的知识,例如,系统15使用WordNet发现单词之间语义相似度和系统24使用命名实体等语言特征,语言模式,词与词之间的语义相似性。
|
||||||||||||||||||||||||||||||||
5.4。与规范DE算法进行比较
gydF4y2Ba本节演示了SaDE-based文档总结的可行性。结果相比,获得的结果从规范德。萨德和规范DE搜索过程中不改变参数CR等于<年代vg height="11.0375" id="M231" style="vertical-align:-0.17555pt;width:59.900002px;" version="1.1" viewbox="0 0 59.900002 11.0375" width="59.900002" xmlns="http://www.w3.org/2000/svg">
gydF4y2Ba表<一个href=”http年代://www.newsama.com/journals/acisc/2011/351498/tab4/" target="_blank">4一个>显示最糟糕的,意思是,最好的,胭脂结果和标准偏差为每个算法DE和萨德在20分。从表<一个href=”http年代://www.newsama.com/journals/acisc/2011/351498/tab4/" target="_blank">4一个>,很明显,最坏的结果由自适应德德甚至比最好的结果。
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||
5.5。运行时的方法的比较
gydF4y2Ba在本节中,CPU运行时的七个测试方法进行了比较。所有的方法都是在Delphi 7中语言实现。算法运行在一个服务器上运行Windows Vista和两个双核英特尔至强处理器(4 GHz)处理器和4 GB内存。表<一个href=”http年代://www.newsama.com/journals/acisc/2011/351498/tab5/" target="_blank">5一个>显示了比较每种方法的时间。最后一列显示时间的方法。从实验结果中,我们清楚地观察到(1)LEX方法执行缓慢;(2)方法iRANK、HierSum HybHSum,和方法PLSA-JS SVR花几乎相等的时间;(3)我们的方法pSum-DE pSum-SaDE取第一和第二的地方,分别。
|
|||||||||||||||||||||||||||||||||||||||
5.6。统计显著性检验
gydF4y2Ba摘要结果的统计学意义判断,一个叫Wilcoxon非参数统计显著性检验的独立样本秩和检验(<一个href=”#B48">48一个>)进行了5%的显著性水平。九组,对应的9个方法(pSum-SaDE (1), (2) pSum-DE, LEX(3),(4)咯+ TF, (5) HybHSum PLSA-JS (6), (7) iRANK, HierSum (8), (9) SVR),为每个数据集创建。两组比较,一个对应于pSum-SaDE方法和相对应的其他一些其他方法考虑。每组由胭脂分数连续20产生的数据集运行相应的方法。值,中值95% CI,标准误差(stdr)胭脂分数的每组的所有数据集如表所示<一个href=”http年代://www.newsama.com/journals/acisc/2011/351498/tab6/" target="_blank">6一个>。
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
从表是显而易见的<一个href=”http年代://www.newsama.com/journals/acisc/2011/351498/tab6/" target="_blank">6一个>,中位数的值ROUGE-1、ROUGE-2 ROUGE-SU4 pSum-SaDE分数是优于其他方法。建立这个善良是统计学意义,表<一个href=”http年代://www.newsama.com/journals/acisc/2011/351498/tab7/" target="_blank">7一个>报告<年代vg height="10.325" id="M267" style="vertical-align:-0.0pt;width:11.75px;" version="1.1" viewbox="0 0 11.75 10.325" width="11.75" xmlns="http://www.w3.org/2000/svg">
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
pSum-SaDE方法的优势也很明显从图<一个href=”http年代://www.newsama.com/journals/acisc/2011/351498/fig2/" target="_blank">2一个>提供解决方案的范围获得的不同的方法(<一个href=”#B49">49一个>]。
(一)年代trong>
(b)年代trong>
(c)年代trong>