研究文章

除了面向强调:调查片段文字突出显示在搜索用户行为的影响

表7

特性用于自动片段文本高亮。

功能 集团 
描述

ifQueryTerm 项是一个查询项是否片段
ifResulttitle 片段的术语是否一个术语在结果标题
ifInWiki 是否片段查询的词出现在维基百科的内容
wikiCount 频率的片段查询的维基百科的内容
ifInBaidu 片段词是否出现在百度百科的内容查询
baiduCount 频率的片断项百度百科的内容查询
ifSearchRec 是否片段出现在查询的搜索建议
searchRecCount 频率的片段查询的搜索建议
queryTermJaccard Jaccard片段之间的距离和查询
queryTermEdit 片段之间的编辑距离和查询
searchResultsOverlap 数量的共享获得的搜索结果列表提交的结果片段的术语和商业搜索引擎查询
wikiTfIdf Tf-idf价值的片段在维基百科语料库(Tf值计算的频率在查询的维基百科的内容片段任期维基百科所有内容在我们的实验中使用的查询是用来计算Idf值)
baiduTfIdf Tf-idf价值词在百度百科语料库的片段。类似于wikiTfIdf
searchRecTfIdf Tf-idf片段价值词在搜索推荐语料库。类似于wikiTfIdf
termTermW2V 余弦相似性的片断项向量和查询项向量(如果查询组成n分割后,然后我们将得到n余弦相似性)
termTermProW2V 一般来说,前三平均、中、最大和最小的termTermW2V

queryTermW2V 查询向量之间的余弦相似性和片段词向量(如果查询组成n分割后,我们使用的平均向量n词向量查询向量)

resultTitleTermW2V 标题向量之间的余弦相似性和片段词向量(如果标题组成n分割后,我们使用的平均向量n词向量标题向量)

searchRecW2V 片段之间的余弦相似性项和搜索推荐语料库。类似于queryTermProW2V