研究文章

无处可藏:小说的私人协议识别算法

算法2

计算协议Jaccard系数。
输入:一组协议切分后频繁模式组= {年代1,年代2,年代3、…年代n}
过滤阈值列表ThresholdList = (th1,2,…)
输出:阈值最高的Jaccard系数值
(1) 初始化结果= {}
(2) 随机设置两套,集一个并设置B:
(3) N克算法叫做得到频繁模式集后两个子集作为gram_list分段
(4) J= 0
(5) 为每个这些thresholdst ThresholdList:
(6) ita在gram_listA和髂胫gram_listB: / /遍历两个gram_list
(7) 如果ita <t:gram_listA.remove (ita)如果结束
(8) 如果国际旅游展的<t:gram_listB.remove(髂胫)如果/ /消除小于阈值的物品
(9) 如果J<卡尔():/ / Jaccard系数的计算
(10) J=卡尔()
(11) 返回结果