研究文章

视觉变压器和深度序列学习人类活动识别监控视频

图6

来说HMDB51精度数据集提出维特和多层LSTM模型。