复杂性

评论文章

话题检测与跟踪技术在Twitter上:系统回顾

表1

Twitter话题/事件检测/跟踪相关研究。


参考	检测方法	检测类型		检测任务		数据收集数据集	检测任务
参考	检测方法	事件	主题	红色的	内德	数据收集数据集	检测任务

(12]	朴素贝叶斯分类器		✓		✓	Twitter API,精心挑选的用户	热点新闻检测
(13]	基于BScore弓集群	✓			✓	Twitter API(线下)	灾难和故事检测
(14]	弓距离相似度	✓			✓	Twitter API	女性性功能障碍(第一个故事检测)
(15]	BNgram和TF-IDF		✓	✓		离线数据集	话题检测
(16]	交叉检查通过维基百科	✓			✓	Twitter API,维基百科	热点新闻检测
(17]	形式概念分析		✓		✓	RepLab 2013数据集	话题检测
(18]	FPM(频繁模式挖掘)	✓			✓	Twitter API	事件检测
(19]	FPM		✓	✓		超级星期二/足总杯我们选举	话题检测
(20.]	FPM(层次聚类)		✓		✓	话题从明确系统数据集	话题检测
(21]	FPM (TF-IDF &n3)改善	✓			✓	Twitter API	事件检测
(22]	GPU改善TF-IDF近似		✓	✓		离线数据集	话题检测
(23]	弓相似	✓			✓	离线数据集	话题检测
(24]	字嵌入					SemEval数据集	Twitter情绪分类
(25]	时空的检测	✓		✓		离线数据集	Targeted-domain事件检测
(26]	聚类的时间和空间特性	✓		✓		Twitter API	事件检测
(27]	地理规律估计	✓			✓	Twitter API	地理事件检测
(28]	弓集群	✓			✓	Twitter API	事件检测与分析
(29日]	概率建模	✓			✓	Twitter API	早期灾害检测
(30.]	FPM	✓		✓		离线数据集	事件检测
(31日]	心跳图	✓		✓		超级星期二/足总杯我们选举	主题/事件检测
(32]	增强的心跳图	✓		✓		超级星期二/足总杯我们选举	主题/事件检测
(33]	句子伯特/流图挖掘		✓	✓	✓	超级星期二/足总杯我们选举	主题/事件检测
(34]	万能句子编码器		✓	✓	✓	COVID-19数据集	COVID-19主题
(35]	TF-IDF CCA, BTM		✓	✓		Twitter API	趋势排名
(36]	LDA、使用和SBERT	✓		✓		COVID-19数据集	COVID-19主题
(37]	Autoencoder和模糊c均值		✓	✓		Berita	趋势排名