评论文章
话题检测与跟踪技术在Twitter上:系统回顾
|
| 参考 |
检测方法 |
检测类型 |
检测任务 |
数据收集 数据集 |
检测任务 |
| 事件 |
主题 |
红色的 |
内德 |
|
| (12] |
朴素贝叶斯分类器 |
|
✓ |
|
✓ |
Twitter API,精心挑选的用户 |
热点新闻检测 |
| (13] |
基于BScore弓集群 |
✓ |
|
|
✓ |
Twitter API(线下) |
灾难和故事检测 |
| (14] |
弓距离相似度 |
✓ |
|
|
✓ |
Twitter API |
女性性功能障碍(第一个故事检测) |
| (15] |
BNgram和TF-IDF |
|
✓ |
✓ |
|
离线数据集 |
话题检测 |
| (16] |
交叉检查通过维基百科 |
✓ |
|
|
✓ |
Twitter API,维基百科 |
热点新闻检测 |
| (17] |
形式概念分析 |
|
✓ |
|
✓ |
RepLab 2013数据集 |
话题检测 |
| (18] |
FPM(频繁模式挖掘) |
✓ |
|
|
✓ |
Twitter API |
事件检测 |
| (19] |
FPM |
|
✓ |
✓ |
|
超级星期二/足总杯我们选举 |
话题检测 |
| (20.] |
FPM(层次聚类) |
|
✓ |
|
✓ |
话题从明确系统数据集 |
话题检测 |
| (21] |
FPM (TF-IDF &n3)改善 |
✓ |
|
|
✓ |
Twitter API |
事件检测 |
| (22] |
GPU改善TF-IDF近似 |
|
✓ |
✓ |
|
离线数据集 |
话题检测 |
| (23] |
弓相似 |
✓ |
|
|
✓ |
离线数据集 |
话题检测 |
| (24] |
字嵌入 |
|
|
|
|
SemEval数据集 |
Twitter情绪分类 |
| (25] |
时空的检测 |
✓ |
|
✓ |
|
离线数据集 |
Targeted-domain事件检测 |
| (26] |
聚类的时间和空间特性 |
✓ |
|
✓ |
|
Twitter API |
事件检测 |
| (27] |
地理规律估计 |
✓ |
|
|
✓ |
Twitter API |
地理事件检测 |
| (28] |
弓集群 |
✓ |
|
|
✓ |
Twitter API |
事件检测与分析 |
| (29日] |
概率建模 |
✓ |
|
|
✓ |
Twitter API |
早期灾害检测 |
| (30.] |
FPM |
✓ |
|
✓ |
|
离线数据集 |
事件检测 |
| (31日] |
心跳图 |
✓ |
|
✓ |
|
超级星期二/足总杯我们选举 |
主题/事件检测 |
| (32] |
增强的心跳图 |
✓ |
|
✓ |
|
超级星期二/足总杯我们选举 |
主题/事件检测 |
| (33] |
句子伯特/流图挖掘 |
|
✓ |
✓ |
✓ |
超级星期二/足总杯我们选举 |
主题/事件检测 |
| (34] |
万能句子编码器 |
|
✓ |
✓ |
✓ |
COVID-19数据集 |
COVID-19主题 |
| (35] |
TF-IDF CCA, BTM |
|
✓ |
✓ |
|
Twitter API |
趋势排名 |
| (36] |
LDA、使用和SBERT |
✓ |
|
✓ |
|
COVID-19数据集 |
COVID-19主题 |
| (37] |
Autoencoder和模糊c均值 |
|
✓ |
✓ |
|
Berita |
趋势排名 |
|
|