TY -的A2 Rajan位于非盟-减少,默罕默德盟——贝博Junaid盟——Ullah Ihsan盟——Daudpota谢尔默罕默德盟——Bakhtyar Maheen AU -井斜,Varsha PY - 2018 DA - 2018/11/08 TI -视频场景检测使用紧凑的视觉词袋模型SP - 2564963六世- 2018 AB -视频分割成镜头是视频索引和搜索的第一步。视频镜头的持续时间通常都很短,不能对视频内容给出有意义的见解。但是,根据相似的视觉内容对镜头进行分组,可以更好地理解视频场景;相似镜头的分组称为场景边界检测或视频分割成场景。本文提出了一种基于可视词包(BoVW)模型的视频分割模型。最初,视频被分成几个镜头,这些镜头随后由一组关键帧来表示。关键帧进一步由BoVW特征向量表示,与经典的BoVW模型实现相比,BoVW特征向量非常简短和紧凑。采用BoVW模型的两种变体: ( 1 ) 经典波夫模型和 ( 2 ) 线性聚合描述符向量(VLAD)是经典BoVW模型的扩展。图像的相似度由关键帧特征向量在滑动窗口内的距离来计算 l ,而不是将每个击球与之前练习过的很长的击球列表进行比较 l 4 。在电影和戏剧视频上的实验证明了我们提出的框架的有效性。BoVW是 25000 -维向量,VLAD仅为 2048 -维向量在提出的模型。BoVW达到 0.90 分割精度,而VLAD实现 0.83 。SN - 1687-5680 UR - https://doi.org/10.1155/2018/2564963 DO - 10.1155/2018/2564963 JF -多媒体进展PB - Hindawi KW - ER -