TY - JOUR A2 - Chu, Wei-Ta AU - Cricri, Francesco AU - Dabov, Kostadin AU - Roininen, Mikko J. AU - Mate, Sujeet AU - Curcio, Igor D. D. AU - Gabbouj, Moncef PY - 2012 DA - 2012/05/17 TI-从用户生成的视频SP -292064 VL -2012 AB中提取多模式语义 - 用户生成的视频内容已经快速增长,以至于超过了专业内容创建。在这项工作中,我们开发了分析多个用户生成视频的上下文信息的方法,以获取有关这些视频中录制的有关公共事件(例如体育和现场音乐事件)的语义信息。这项工作的关键贡献之一是共同利用不同的数据模式,包括在每个用户执行的视频录制过程中辅助传感器捕获的。特别是,我们分析GPS数据,磁力计数据,加速度计数据,视频和音频包含数据。我们使用这些数据模式来推断有关正在记录的事件的信息,以布局(例如体育场),类型,室内与室外场景以及事件的主要兴趣领域。此外,我们提出了一种方法,该方法自动识别在多摄像机视频制作中使用的最佳相机集。最后,我们检测到在同一公众发生的其他相机录制的视野内的相机用户。我们表明,所提出的多模式分析方法在真实的体育活动和现场音乐表演中获得的各种录音中表现良好。SN -1687-5680 UR -https://doi.org/10.1155/2012/292064 do -10.1155/2012/2012/292064 JF-多媒体PB的进展