国际期刊的数字多媒体广播

PDF
国际期刊的数字多媒体广播/2010年/文章
特殊的问题

视频分析、抽象和检索:技术和应用程序

把这个特殊的问题

研究文章|开放获取

体积 2010年 |文章的ID 836357年 | https://doi.org/10.1155/2010/836357

梁曹、徐昌盛Hanqing陆, 个性化的体育视频定制使用内容和上下文分析”,国际期刊的数字多媒体广播, 卷。2010年, 文章的ID836357年, 20. 页面, 2010年 https://doi.org/10.1155/2010/836357

个性化的体育视频定制使用内容和上下文分析

学术编辑器:Jungong汉
收到了 02年9月2009年
修改后的 2009年12月11日
接受 2010年1月26日
发表 2010年4月22日

文摘

我们提供了一个完整的框架定制个性化的体育视频,这解决了三个研究问题:语义视频注释,个性化的视频检索和总结,和系统适应性。体育视频注释作为视频定制系统的基础。获得视频内容的详细描述,外部web文本采用结合相关的体育视频根据其语义对应。基于推导语义注释,user-participant多约束背包0/1模型设计模型的个性化视频定制,可以统一视频检索和总结不同融合参数。作为衡量系统自适应的特定用户,基于社交网络的系统适应学习潜在用户偏好隐式算法。两个定量和定性实验12播放篮球和足球视频验证该方法的有效性。

1。介绍

先进的项目生产技术的扩散和多个电视广播频道造成了一个了不起的体育视频内容的增长及其在公众中越来越受欢迎。然而,这样增加可用性尚未伴随着改善其可访问性,这意味着观众能做的只有被动地看整个比赛编辑工作室专业人士一旦他们选择它。因为有趣的片段通常占整个匹配的一小部分;这种被动的观看模式不仅会损害观众的观看体验,也浪费了他们的时间和金钱。为了解决这个问题,能够提供个性化的视频内容按照个别观众的特性是非常重要的。

直觉上,观众的区别首先是通过在对语义内容的多样化偏好特定的球员和视频中出现的事件。例如,贝克汉姆的球迷可能主要集中注意力在这个足球明星比其他任何球员,而NBA的观众可能更喜欢看灌篮比任何其他事件。源视频来满足这些需求,必须分析更精致的规模和更高的语义层面的东西。更准确地说,视频分析不应该仅仅用简单的概念标记一些突出的事件,例如,在篮球或足球犯规,但是注释各种事件详细的语义描述,包括涉及的球员(s)、事件类型(s),结果后果。

除了视频内容个性化、观众的个性也反映出在不同的定制模式和环境。在这里,视频定制模式调节视频片段的具体选择标准。为观众关注特定的球员或事件,部分语义一致的观众的兴趣更好,而对于观众感兴趣的游戏的全球局势,段,最好可以捕捉比赛的主体更可取。至于定制环境中,它表示多个约束条件在实际使用,例如,内存容量、电量和传输带宽,等等。所有这些物理条件因人而异,并直接影响最终定制的结果。

视频不仅在于个性化定制显示内容,而且还体现在系统适应特定的观众。这是一个重要的功能的智能系统可以更容易使用的用户继续使用它。用户偏好的学习是一种有效的措施来解决这些问题。通过分析用户的显式或隐式反馈,一个智能系统可以自动推断潜在用户的偏好和自适应地调整其结构或/和参数为未来更方便使用。

在本文中,我们的目标是提出一个体育视频个性化框架,通过它用户可以享受精致的视频片段包含他们喜爱的语义在任何地方随时冗长的体育比赛。主观和客观内容偏好环境约束将是完全平衡的,所以最佳视觉体验可以带到特定的观众。特别是,我们采用篮球和足球比赛作为初始运动类型,因为他们不仅是广泛采用研究床还全球流行的项目,在研究和应用具有巨大的价值。此外,由于该框架是通用的,我们相信,我们的方法可以易扩展到其他体育领域。

剩下的纸是组织如下。相关工作在体育视频分析、检索、汇总和用户偏好学习了部分2。提出的问题制定和框架描述部分3。体育视频注释的技术细节,定制个性化的视频,和系统适应性提出了部分4,5,6,分别。实验结果发表在部分7。我们在部分总结本文对未来的工作8

广泛的研究工作一直致力于体育视频分析和应用程序由于其广泛的收视率和巨大的商业潜力。在本节中,我们给出一个简短的回顾相关工作对体育视频注释,检索,总结和用户偏好的学习。

2.1。体育视频分析和注释

体育视频分析和注释的目标检测和识别的语义内容。之前的大部分工作是基于音频(1- - - - - -3)、视觉(4,5),和文本(6,7)功能直接从视频中提取内容本身。这种方法的基本思想是利用启发式规则(8)或机器学习算法(9,10从各种低级[]来推断语义事件11)、高中阶段(12)功能。因为体育视频是一个集成的各种形式的信息,算法基于多通道融合更容易实现健壮的和准确的事件比single-modality方法检测结果。例如,视听功能被成功用于检测事件在篮球13),足球(14],板球[15),和网球16];audiovisual-textual特性也在分析合作棒球(17],板球[18),和高尔夫球19)比赛。

然而,由于低层特征和高层语义之间的语义鸿沟,基于内容的方法,无论使用单或多峰性,只能注释某些重要事件简单的概念,它无法满足观众的个性化需求为特定的球员和事件。为了获得更丰富的高层语义,外部文本信息介绍,以方便视频注释和取得了令人鼓舞的结果。Babaguchi等(20.)提出了一种多通道策略使用闭合字幕进行事件检测和视频索引。徐和蔡21)提出了一个综合的方法来对齐文本事件匹配相位信息来检测多个事件在足球视频。徐等(22)使用网络广播体育网站的文本检测事件语义,取得了令人振奋的结果。

2.2。体育视频检索和总结

至于体育视频分析的直接应用,检索和自动摘要)代表了两种典型的定制模式。视频检索可以被视为一个点查询,用户关注特定的人或事件,虽然视频摘要可以被视为一个平面查询,用户更关心整个比赛的情况。

方法只使用低级特征,和各种慢动作回放部分突出段主管候选人视频摘要。在[8),郑伊健et al总结了足球视频镜头类型分类和检测慢动作回放。在[23,24),整个体育视频被划分为一系列播放/打破部分和亮点是分配给部分完整的体育视频摘要。方法使用文本特性,视频定制可以有效地将用户的偏好和在语义层面上运作。别的,罗伊25)提出了一个无监督体育视频检索方法,重复时间视觉模式搭配相关闭合字幕文本。Babaguchi等(26)提出了一个个性化的视频检索基于丰富的语义描述和总结框架从闭合字幕获得认可。

考虑各种实际使用环境的限制,如网络流量和设备内存、资源约束视频定制也收到广泛关注学院(27,28)和行业(29日]。

2.3。系统适应性

适应是一个重要的机制,使信息系统能够为特定用户提供个性化服务。通过学习用户偏好,个性化系统能够自适应地调整其结构和/或参数提供更多的服务。

在以往的研究中,相关性反馈是代表明确的用户偏好的方法学习。主要的思想是利用人机交互直接指导系统适应,以便它可以提供集中服务特定用户。张等(30.)设计了一个相关性反馈策略来获取合适的体育视频剪辑来满足用户的要求。通过计算选择视频的语义和视觉一致性段,用户的个性化偏好可以适当的量化和满意。阿米尔等(31日)提出了一个相互关联的反馈方法多通道视频检索查询公式。基于相关照片的用户,系统可以自动识别有用的搜索词精炼检索结果。

由于耗时的交互在显式反馈,利用隐式反馈使系统自适应用户以更少的干扰。用户概要分析是一个典型的隐式的用户偏好的学习方法。Syeda-Mahmood和Ponceleon32]采用隐马尔可夫模型来预测用户的历史浏览行为的内部状态,然后生成指定的视频预览特定的观众。齐默尔曼等(33)两种隐式推荐系统,使用贝叶斯分类器和C4.5决策树学习从他们的浏览历史和用户的偏好与神经网络融合多个推荐生成用户最喜欢的电视节目。

3所示。问题公式化和框架

视频注释作为个性化视频定制的基础。需要连接低级视听领域的责任与高层语义。相比之下,基于内容的注释方法利用外部文本信息可以提供更详细的视频内容的语义描述。目前,两种类型的外部文本来源,隐藏字幕和16文本,用于语义视频分析。闭合字幕,尽管它拥有视频文字同步的固有优势,它面临的挑战是准确信息提取不规则和变量口语,而对于16文本、反向应用,这意味着它有明确的语法结构,但缺乏直接视频文字的信件。大多数相关工作(22,30.)采用时间戳作为关键环节连接这两个媒体。然而,这些方法通常局限于低时间戳识别准确性由于嘈杂的广播视频。此外,可用性和时间戳的具体风格总是由程序决定的生产商,这进一步限制了可扩展性的基于时间的方法。

详细的语义注释,两个研究挑战需要解决个性化视频定制:首先,公司的高层语义视频内容选择,其次,用户偏好之间的平衡和环境约束。如果我们考虑定制问题从优化的角度,第一个挑战定义了一个目标函数来评估语义视频片段的重要性,而第二个挑战模型约束优化问题的基础上,上述目标函数通过添加环境约束。之前的大部分工作集中在只有以上两个问题的一个方面,无论是语义内容的选择(25,26)或资源受限的应用程序(28,29日];所有这些缺乏综合考虑上述两个挑战。

实践“以人为中心的多媒体”的概念34),它是信息系统的责任而不是用户适应提供更方便的服务。的用户,一个理想的个性化系统应该学习他/她尽可能准确、无意识的偏好。然而,这两个需求通常不兼容的实际实现。具体来说,显式反馈(30.,31日]给出了准确的用户偏好,但需要额外的交互,而内隐推理(32,33)需要更少的操作,但可能会导致不完整的学习。

在这篇文章中,我们将解决这一挑战现有的在前面的语义标注方法,个性化定制,和系统适应性。对上述问题的解决方案在这三个字段构成一个集成系统提供定制个性化的体育视频。与以前的工作在相关的领域相比,我们的方法总结了如下的主要贡献。(1)我们提出一个集成框架,提供个性化的体育视频定制。全面战略在语义注释,个性化定制,和偏好学习,用户可以方便地定制自己感兴趣的视频片段有关特定的球员或事件。(2)我们提出一个新颖的体育视频注释方法,视频内容和16文本一致的语义对应的时间序列。由于语义是一种内在的存在在多媒体、更通用的和健壮的跨媒体分析。(3)我们提出一个user-participant多约束背包0/1模型定制个性化的视频,用户内容偏好和环境限制可以良好的平衡和满足。(4)我们提出一个基于社交网络的系统适应算法将本地用户交互信息传播视频语义网络,完成用户的偏好可以隐式地推断和学习。

1说明了我们建议的方法框架。首先,层次语法匹配方法来生成详细的视频注释以离线的方式。然后,user-participant内容定制算法提供实时视频内容定制资源约束环境下。同时,为了促进上面的定制过程中,网络是建立一个概念来捕获潜在用户偏爱有效系统的适应。

4所示。体育视频注释

体育视频注释负责生成详细的视频内容的语义描述。最近的工作(22,35)主要集中在基于视频文字对齐,时间戳的可用性和识别两个主要瓶颈限制应用程序的方法。克服这些缺点,我们提出一个semantics-matching方法(36体育视频和16)对齐文本基于语义对应。由于语义各媒体无处不在,不是容易事后编辑和传输,该方法被认为是更通用的跨媒体分析。

4.1。Attack-Based粗对齐

执行语义匹配之间的视频和文本,首先要找到共同的抽象单位,可以可靠地提取来自媒体。一旦确定了这样一个单元,语义桥连接配对媒体可以有效地建立。根据体育视频功能,attack-based分析方法(37提供一个合适的选择。因为攻击的概念存在于大多数对手运动和有非常明确的语义,攻击方面的变化是一种天然的游戏视频和文本的分割准则。

以下4.4.1。视频标签

视频标签模块旨在生成一个语义标签序列,每个标签对应的攻击段的匹配。这里,攻击是定义为一个完整的团队尝试(球员)的对手一分运动。它指的是一个宏观的过程,而不是一个特定的事件;因此它不仅包括明显的进攻像拍摄的事件或目标的攻击,但也包含其他nonoffensive事件像犯规或返回的过程中通过。

根据上述定义,一致的移动部分从法院的一边到另通常对应于一个完整的攻击单位。然而,由于激烈的竞争在体育比赛中,分割结果很可能受到大量的运动模糊。为了克服这个困难,我们第一次平滑(相机水平运动38)通过现场区域信息(21]这样模糊运动片段没有明显位置变化可以过滤掉。然后,attack-based视频分割获得序列的边界在每个剩余运动段的起点。一个现实的例子,上面的流程见图2,其中蓝色实线表示字段区信息(1.5表示左外野, 正确的字段和0年中字段)和绿色dash-dot线代表水平相机运动(1表示左移动, 向右移动)。

attack-based视频分割后,一群中层二进制特征包括镜头类型转换(只有长和nonlong照片被认为是在我们的方法)( )[39),慢动作回放( )[35),裁判吹口哨( )[13)提取每个攻击段和一个启发式的贝叶斯网络(见图3)是训练检测开枪犯规事件如下: 在哪里 是二进制变量对应的现有状态开枪攻击段和犯规事件吗 是他们的推断。最后,检测到攻击方向和语义事件进一步组合编码的二进制状态(见表1),因此整个视频标签过程可以表示为一个简洁的形式如下: 在哪里 代表最终的视频标签编码的组合攻击方向( )和隐式语义事件( )。


语义 攻击方向 语义事件
标签 向右 在左侧 枪击事件 犯规事件

“一个” 真正的
“b” 真正的 真正的
“c” 真正的 真正的
“d” 真正的 真正的 真正的
“一个” 真正的
“B” 真正的 真正的
“C” 真正的 真正的
“D” 真正的 真正的 真正的

4.1.2。文本标签

文本信息的利用率显著促进视频内容分析。相比之下,标题文本覆盖在图像(6)或在视频编码(20.文本),16 (22)有明显的优势。( ),它可以在ESPN等许多著名的体育网站(http://sports.espn.go.com/)和英国广播公司(http://news.bbc.co.uk/sport2/hi/football/teams/),可以及时访问期间或之后的游戏。( )在一个定义良好的组织结构,易于解析。( ),它含有丰富的比赛描述难以获得完全从内容分析(见图4)。因此,我们利用16文本方法促进语义视频注释。

类似于基于内容的视频标记过程,16文本分析还旨在生成一个语义标签序列,每个标签对应于一个完整的攻击在游戏中尝试文本。自16文本标记由提供的体育专业人士和著名的网站,它的使用标准和固定的单词和语法结构。因此,语义事件可以可靠地检测到的关键字搜索。表2列出所选事件及其相关关键字用于我们的方法;所有这些通常在比赛中有趣的事件,可以根据用户的喜好灵活扩展。


事件 相关的关键字 攻击属性

篮球 拍摄 使上篮,钩,跳投,罚球 进攻
小姐 小姐 进攻
国防
偷来的 偷,输了球,不好通过 国防
犯规 犯规 进攻/防守
反弹 进攻篮板,防守篮板 进攻/防守

足球 拍摄 ,目标,头,得分 进攻
任意球 任意球 进攻
角落里 角落里 进攻
犯规 犯规 进攻/防守
红牌,黄牌 进攻/防守
越位 越位 越位

与文本事件检测、attack-based文本分割可以制定集群相邻的文本事件分为个人组,每一组对应于一个完整的进攻在比赛中尝试。按照惯例组成16的文本,相邻记录与一致的攻击方向总是属于相同的攻击过程。因此,我们可以通过分析集群事件记录当前的攻击一边(中科院在每个文本事件)。在对手运动,中科院是一个重要的二元特征指示哪支球队处于进攻状态当当前文本事件正在发生。一边的犯罪事件和对方的防御事件对应于相同的中科院价值。它可以可靠地从文本中提取记录通过分析会员和事件的玩家攻击属性(列在表2)。例如,给定一个文本事件说“里德让上篮”,我们可以知道它代表了进攻从关键字“上篮”和事件中科院雄鹿,Michael Redd属于的团队。一旦所有中科院从文本中提取特征的事件,可以很容易地确定段边界,依次比较相邻的两个中科院特性。为了更好地理解上述过程,详细的算法流和一个例子中科院检测图5

当使用以上文字分割算法,实现细节需要解决。从表可以看出2,除了反弹事件,所有其他事件有双重攻击属性犯规事件有关。因为这些事件可以发生在防御和进攻的双重攻击,他们的攻击属性总是很难确定从一个单一的文本记录。为了解决这个问题,我们利用他们的前一事件的中科院特性和当前事件的相关团队共同决定当前事件的攻击属性。具体地说,如果目前的事件是由一个属于进攻球员在前面的事件,它的攻击属性是进攻,否则防御。这样的规则是基于假设攻击方面不太可能改变两个相邻事件当后者犯规事件(如果不是这样,必须有一个事件之间造成攻击方面的变化,与假设矛盾的两个事件是相邻的。)。我们的实验也证明这种假设的合理性。

在比赛中进攻端检测,相关攻击方向可以很容易地推断出通过比较两支球队之间的攻击段比率文本和视频两个方向。然后,可以进行类似的编码过程生成文本语义标记序列。

虽然视频和文本标签处理步骤和输出相似,我们必须强调这两个序列是本质上的不同。对于前者,每个标签是一个随机变量,最后推导出视频序列由最可能的语义标签给中层特征的观察从视频中提取攻击段。相比之下,每个标签的文本序列是一个常数序列被确定在一个确定的方式。这样的差异提供了方便的标签相似度测量下面的小节。

4.1.3。Attack-Based序列匹配

视频分析的输出是一个标签序列精确攻击边界(视频拍摄的),但不准确的语义标签(由于语义差距),而文本分析的输出是另一个标签与准确的语义序列标签(关键字匹配)但没有视频边界信息。因此,一个直观的方法注释体育视频的攻击是准确对齐文本标签序列与其相关的视频。考虑到语义标记序列,我们提出一个基于语义Needleman-Wunsch算法(36)与常数匹配概率视频序列文本序列。与其他算法相比,该算法搜索最优对齐基于全球语义对应,因此更健壮的地方不准确的视频标签序列中的错误。

标准Needleman-Wunsch算法(40)本质上是一个动态规划算法,最初的目的是找到最好的蛋白质或核酸序列匹配在生物信息学。它实现多级决策过程,提出计算计算最优局部匹配分数在不同匹配模式和逆向跟踪确定全局最优序列比对。考虑两个序列之间的匹配问题, , 元素,分别。在计算,得分矩阵 行和 列是第一次分配,每一行对应一个元素 和每一列元素 。的 矩阵的条目子序列之间的局部最优比对的得分记录 。向前计算以迭代的方式,实现的价值 是由相邻的三位前辈的决定如下: 在哪里 之间的相似性得分吗 视频标签 文本标签 , 表示惩罚的差距给一个空匹配。在(3),前两项对应于向右(gap-element)和下行(element-gap)匹配元素在一个序列无法找到对应的其他序列;因此匹配生成的缺口。第三项(3)代表一个对角线(element-element)匹配的元素之间的相似度 计算。通过比较最终对准分数来自三个方向,得分最高的是分配给 和相关的方向是存储在相应的位置大小相同 回溯矩阵 。作为整个得分矩阵分配,相关回溯矩阵也满了。从右下角开始回溯的矩阵,全局最优定位路径可以最终通过追溯以及存储本地匹配的目录。上面的图形演示算法流程如图6,数字在茂密的深黑盒和方向图6(一)分别构成了分数和回溯矩阵,图中红色箭头6 (b)显示最后回溯目录对应于最优序列对齐。三个不同的匹配类型图6 (c),马克。” ”马克表示确切相同的元素之间的匹配和“:”表示不同元素之间的不精确匹配。至于空匹配,无标记。

从上面的讨论,提出计算得分矩阵作为Needleman-Wunsch算法的核心部分。它会影响最终的校准结果通过决定局部比对的方向。在生物信息学领域,序列元素通常对应于特定的化学物质,从而给出了匹配分数基于它们的化学结构和性质。然而,在体育视频的特定应用程序和游戏文本对齐,因为每个元素是一个字符序列标签代表的高级功能和事件的组合,应该根据他们的语义标记对齐分数相似之处。

因为视频标签本身是一个离散随机变量的值 对应于最大的概率分布生成的贝叶斯网络,视频标签之间的语义相似度 和文本标签 可以间接测量条件概率的区别当视频标签变量的值 ,鉴于中层特征的观察。在我们的方法中,我们制定的视频和文本之间的相似度测量标记如下: 在哪里 视频标签变量和吗 , , 代表视听功能描述部分4.1。1。自攻击方向可以可靠地确定视频和文本标签对应不一致的攻击方向不准对齐的方法。方向一致的条件,近端之间的推理概率标记 是,越有可能吗 可以用来代替吗 注释相关的视频片段,换句话说,越有可能视频片段标记 可以与文本组标记 。此外,由于 对应的最大条件概率在视频标记过程中,标签相似 永远不能比 ,只能达到精确匹配。

至于点球的差距,它被定义为一个函数的语义事件攻击段中包含: 在哪里 代表最可能的现有开枪犯规事件生成的状态(1), 成本定义为仿射差距吗 第一缺口 为别人在我们的实验。根据上面的方程,包含在攻击事件越多,就越有可能找不到相应的文本标签,因此,强烈的惩罚将给其空对齐,反之亦然。表3描述了基于语义提出Needleman-Wunsch标记序列比对算法广播体育视频和16之间的文本。


输出 排列顺序
输入 视频标签序列 和文本标签序列

一步 提出了计算
一步 分配一个得分矩阵 和方向矩阵
这两个矩阵都用 行和 列。
一步 填满所有条目 从左到右下角。
(我) ,其价值是计算(3), 计算(4)和(5)。
(2) ,它的价值是最优匹配方向所示 在(3)。

一步 向后跟踪
一步 分配一个对齐序列 元素。
一步 填满的条目 在反向追溯
(我) ,其值等于 ,在那里 对应的坐标 回溯一步

一步 结果的解释
一步 三个可能的值(方向)可能出现在 ,这是
(我)对角线对应” “对齐,
(2)向下,对应“ “对齐,
(3)向右,对应“ ”对齐。

如果我们考虑一个时间戳标记,以前的基于时间的方法可以视为我们的方法的一个特例。然而,存在两个重要的差异。首先,标签在我们的方法是高层语义而不是低级视觉特征,这是一个内在的和通用的链接多媒体。第二,全球结构而不是单个等效利用视频和文本对齐序列,大大提高该方法的鲁棒性与当地错误。因此,提出semantics-matching方法被认为是通用的跨媒体分析更有效。

4.2。Shot-Based精制对齐

attack-based对齐的输出结果是一个粗但准确的注释,在基本单元对应的攻击段而不是一个特定的事件。获得一个更复杂的事件检测结果,定位特定的视频语义事件,我们之前重复序列匹配算法在每个攻击的规模产生shot-level视频注释。与基本序列的方差匹配粒度单位改变攻击段的视频和文本中的事件记录。自从远射时总是采用描述全球局势比赛仍在玩,他们是唯一类型用于精制对齐。

虽然shot-based精制对齐之间缺乏直接的语义对应体育视频和网页文本,它实际上生成更复杂的注释在拍摄的水平。此外,我们的实验也表明,这种语义的弱点在细化过程中基于粗对齐的结果并不重要,因此完全可以接受的。

最后视频注释结果存储在标准XML格式MPEG-7高效的检索和管理。如图7,XML文件被组织为层次结构,依照相关的体育比赛,整个比赛包括几个季度,每季度包含一组事件。每个事件的匹配,XML文件记录的详细信息,包括其涉及球员(s),事件类型和时刻,当前的分数和相应的视频片段。

5。定制个性化的视频

个性化定制视频旨在调整适当的特定用户的视频内容。不同于一般的突出表现(工作23,24]在有趣的视频完全决定通过视频内容分析,提出定制方案中合作视频内容的视频语义和用户偏好选择的过程。此外,考虑质量视频内容之间的冲突和有限的用户环境,平衡的定制策略也向观众的观看享受不同上下文约束下最大化。

5.1。事件重要性计算

评估的质量选择视频片段、事件重要性计算是必不可少的。事件对比赛的影响及其相关性考虑用户的要求。影响计算、事件等级和发生时间是两个主要因素(41]。相关性度量,语义一致性涉及球员和事件类型。

(1)事件等级
的秩事件直接取决于游戏状态的影响。考虑到篮球和足球比赛的区别,两个代表等级标准采用评估事件的重要性在这两个运动类型。因为枪击事件是常见的在篮球比赛中,比赛领袖和分数差距的变化作为事件重要性评价的指标。而对于足球比赛,有影响力的事件被限制在有限的类型,因此只有开枪卡事件排名。表中给出的排名列表4,rank-based事件的重要性 定义如下: 在哪里 代表事件的等级水平 表示可调参数来控制事件重要性等级差异计算的影响。


等级水平 事件描述
篮球 足球

1 分数事件及其归纳犯规事件,可以改变游戏的领袖 分数(目标事件)
2 分数事件及其归纳犯规事件,保留游戏领袖但改变得分差距 犯罪事件和红牌事件
3 犯罪事件未能进球和常见的犯规事件 黄牌事件
4 所有其他事件,并不在等级1 - 3 所有其他事件

备注:以上描述,分数事件指的是攻击事件导致分数,而进攻事件指的是攻击事件没有导致一个分数。

(2)事件发生的时间
在体育比赛中,事件发生在双方比赛通常是至关重要的,因为没有时间留给改变最终结果。在我们的方法中,基于事件发生时间的重要性 定义如下: 在哪里 是事件的总数量, 的指数 , 是可调参数来控制事件发生时间事件重要性的影响计算。

(3)事件的相关性
不同级别和类型发生时间事件本身所决定的,事件之间的相关性反映了语义一致性事件内容和用户的偏好。这个项目中扮演一个重要的角色在我们的个性化定制,因为它有效地介绍了事件重要性计算用户的意见。通过增加语义相关事件的重要性评分,系统终于可以向特定用户定制个性化的视频内容。基于语义视频注释、事件相关性的重要性 可以被定义为: 在函数 测量事件之间的语义一致性 和用户请求 的主题涉及球员和事件类型,和可调参数 表示用户偏好之间的上述两个科目。

(4)学习的偏好
与用户偏好学习,系统可以为特定的用户提供更合适的视频内容,因为他们继续使用它。这个函数实现了自适应地调整概念重量按照用户的输入。计算基于偏好的学习活动的重要性 在部分将讨论吗6

基于上述分析,事件的重要性可以计算为: 在哪里 是融合参数分布事件影响匹配的重量吗 用户请求和其语义的一致性

5.2。User-Participant多约束背包0/1模型

与上述事件重要性的评价方案、用户偏好可以有效地纳入视频内容的选择过程。然而,相比之下,质量适合视频数据,用户可以查看的条件,例如,设备内存,看时间,通常不是无限的。因此,如何提供最佳的视频内容资源约束环境下具有十分重要的现实意义和研究[28,42]。Merialdo et al。42)提高了0/1背包问题模型viewing-time-limited电视节目个性化。然而,由于缺乏语义分析的视频内容,只感兴趣类别而不是内容被认为是在视频个性化系统的偏好。魏et al。28)提出了一个Multichoice多维背包的策略,最大限度地提高总信息在多个环境约束。因为他们的方法需要包括每一个视频片段(在不同的抽象级别)最后的总结,这不是合适的定制有针对性的视频,只有视频片段包含特定的语义是必要的。出于在以往的研究中使用的优化模型,我们制定个性化的视频定制user-participant多约束(UPMC) 0/1背包问题: 在哪里 代表了综合价值重要性的事件 在指定的用户请求 , 资源消耗的 事件, 是客户端资源绑定的 资源, 表示的存在 事件在选定的最佳设置 代表事件的数量和资源类型。

我们可以看到从(9)和(10),该视频定制策略采用一个约束优化模型以及平衡用户内容偏好对多个资源的局限性,从只有视频片段拥有更高的重要性值可以选择到最终定制的结果。融合不同参数,两个典型视频定制模式,检索和总结,可以以一种统一的方式对待和无缝切换。具体地说,在的情况下 近似为0,事件重要性主要是由用户决定偏好,因此只能分配视频段的语义一致性更高的重要性分数并最终呈现给用户。在的情况下 近似为1,事件重要性主要是比赛本身,因此所选事件可以反映比赛的全球局势。此外,随着无偏融合的配置参数( ),一个新的定制模式,可以实现个性化的视频摘要。在这种情况下,用户可以查询视频摘要关于指定的玩家或事件。

6。系统适应性

自用户偏好相对稳定一段时间,预计定制系统适应函数响应特定的用户提供更合适的结果但不需要交互。为了实现这一目标,完成用户的偏好应该尽可能隐式地学习。然而,杜甫的完整性通常冲突,因此以前的工作很难达到最优的平衡这两个索引。克服这个困难,我们提出一个基于社交网络的方法来识别潜在的用户偏好没有额外的交互。通过构建视频语义的社交网络,用户偏好对特定概念可以有效地传播在网络边缘,这样他们潜在的态度可以隐式地推断出其他非特定的概念。

6.1。社交网络概念

我们借的社会网络分析(SNA) [43体育视频中)描述概念之间的关系。社交网络是一个社会结构由个人称为“节点”,由一个或多个连接特定类型的相关性。图形表示的个人关系,系统网络体系结构(SNA)可以利用图论的相关属性和理论发现隐藏的结构/属性不能直接感知或测量44]。根据体育视频语义标注,为球员和两个平行的社交网络事件实体定义如下: 在哪里 代表的球员在比赛中出现, 是一个二进制矩阵表示球员之间存在的关系 , 表示球员之间的关系的力量 。可以从事件中获得类似的解释网络

上面建立加权网络概念,概念的量化关系是至关重要的。在体育比赛的场景,开发概念之间的关系,当他们出现在类似环境相匹配。在这里,比赛环境指的是事件类型当我们考虑网络和指的是球员的玩家当我们考虑事件网络,换句话说,球员和事件是相互匹配的。因此,经常两名球员出现在相同的事件,它们之间的密切关系是建立在玩家网络,我们可以量化这种关系随着共存于同一数量的匹配两个玩家之间的上下文。类似的结论也可以来自网络。

获得体育视频语义标注,可以视为两偶图匹配图8(a),广场节点表示事件,圆圈表示节点之间的边缘球员和一对事件和球员节点代表在同一文本共存的事件。为配合 事件和 球员,上述两偶图可以表示成一个矩阵 ,那里的条目 代表的共存时期 事件和 玩家在同一文本事件。的 列, 的矩阵 代表之间的共存时代 球员和其他 事件, 行, 的矩阵 代表之间的共存时代 事件和其他 的球员。基于event-player两偶图,我们可以构建社交网络概念如下: 在哪里 分别对应于事件和玩家网络。

在图的例子8,生成的事件和球员之间的社交网络数据8(b)和8(c),厚的优势是,越相似的两个概念匹配上下文。带之间的边缘 在图8(b)作为一个例子,它是最厚的一个在所有三个边缘,这意味着这两个事件通常发生在相同的球员( 在比赛中)。因此,等用户事件 ,他们可能也感兴趣 因为他们可能喜欢 。这种分析可以应用于玩家网络,其匹配上下文是指cooccurring事件。

6.2。用户偏好的学习

社会网络分析的帮助下,完成用户的偏好可以有效地推断出从有限的定制过程。为了方便讨论,我们引入一个concept-weight一对, ,来描述用户偏好度 概念( 在比赛中)。此外,由于对称事件的处理和类似的结论和球员的概念,我们不会区分这两种概念,除非它是必要的。

最初,所有概念的权重设置为0。当 概念作为关键词在视频定制,它被视为一个明显的有趣的概念给用户。因此,新的重量 概念的最后的重量 是由以下方程: 在哪里 是一个约束的增量的概念偏好。

至于其他的概念不是由用户指定,我们进一步把他们分成两类,与概念 概念在社会网络和那些不。对于前者,我们分配重量增加 这些潜在的概念根据他们的链接强度 概念如下: 在哪里 代表之间的边缘的重量 社交网络的概念。的概念,它既不是指定的用户或与指定的概念,他们的偏好权重减少如下: 在哪里 偏好是一个常数阻尼因子的概念。

与方程(13)- (15),用户偏好中的所有概念匹配识别。为了避免重量差异,采用规范化的流程: 这样规范化概念重量不大于1。相应的基于偏好的学习活动的重要性 可以计算为: 在哪里 对应于规范化偏好权重的球员在事件和事件概念

7所示。实验结果

为了评估该方法,我们进行我们的实验超过1000分钟的广播体育视频,包括NBA 2 2005 - 2006年和4 2007 - 2008年NBA篮球比赛,2 2004年欧洲杯4 2006年世界杯足球比赛。得到相应的16文本从ESPN和BBC体育网站。平均大约有400文本事件发生在一个100分钟的篮球比赛和50个文字记录在一个90分钟的足球比赛。

7.1。体育视频注释

在本部分中,attack-based视频和文本分割,粗和精制视频注释,与基于方法和比较实验报告来验证提出的语法匹配算法的有效性。

评估获得的分割结果,提出的“纯度”指数(45在我们的实验中采用。给定一个序列数据,地面实况分割 和一个自动分割 ,纯洁 被定义为: 在哪里 现场分割重叠的长度是 , 现场的长度是 , 是总长度的场景。在每一个括号,第一项是分数的记录一段账户,第二项是衡量一个给定的部分分成小片段。纯度值范围从 。值越大,结果越接近接近地面的真相。

手动贴上地面实况分割,attack-based视频和文本分割结果图9。文本分割结果的一致的优势在体育视频反映了语义attack-based分割的直觉说。个人网页文本中的错误主要是疏忽造成的一些文字记录当攻击方面发生了变化。至于相对低纯度的视频分割、大规模的传递和不准确的字段区信息(特别是足球比赛)是主要原因。然而,虽然有不准确、attack-based视频和文本分割在篮球和足球比赛通常是可行的以下语义视频注释。

采用Leave-one-cross验证评估视频注释结果。为每个运动类型,5场比赛训练贝叶斯网络用于突出事件检测和左边的一个是用来测试注释算法。attack-based分割,粗糙的视频文字对齐结果列在表中5,推理精度表示职业的正确检测到标签总视频标签和对准精度代表所有正确的职业匹配标签总视频标签。


不。 体育 确切的 不精确的 推理 对齐
类型 视频标签 匹配 匹配 精度 精度

1 篮球 192年 143年 44 74% (143/192) 97% (187/192)
2 篮球 196年 152年 42 78% (152/196) 99% (194/196)
3 篮球 188年 133年 49 71% (133/188) 97% (182/188)
4 篮球 176年 144年 26 75% (144/176) 97% (170/176)
5 篮球 187年 150年 33 80% (150/187) 98% (183/187)
6 篮球 185年 140年 38 76% (140/185) 96% (178/185)

7 足球 55 45 8 82% (45/55) 96% (53/55)
8 足球 50 43 6 86% (43/50) 98% (49/50)
9 足球 53 44 5 83% (44/53) 93% (49/53)
10 足球 53 47 3 88% (47/53) 95% (50/53)
11 足球 51 45 4 88% (45/51) 96% (49/51)
12 足球 45 39 2 87% (39/45) 91% (41/45)

如表所示5推理精度平均只有77%,篮球比赛和足球比赛为86%,这反映了语义鸿沟的负面影响在基于内容的事件检测。然而,在有限的推理精度相比,粗对准精度仍令人满意(约98%,篮球和足球比赛resp。95%)。这个结果表明该序列的强鲁棒性匹配算法,可以归因于基于语义标签相似性度量和全局优化策略,在不同的标记可以有效地与参考全球匹配状态。

Attack-based视频文字对齐生成一个粗但准确的视频注释,在比赛中基本单元对应的攻击。获得更详细的注释、精制对齐定位每个文本事件进行拍摄。图10给的精制注释结果 篮球和事件 事件在足球比赛。由于缺乏语义关系,shot-based对齐attack-based一是不准确的。然而,准确的帮助下粗对齐,下面shot-based细化仍然可以注释大多数事件在一个可接受的精度。至于低精度/召回率的枪击事件在篮球比赛中,它主要是由于不规则的摄影在罚球事件短镜头而不是远射被摄像师收养了。类似的结果也出现在任意球和足球比赛犯规事件,相机过渡期间这些事件的频繁和动态的。

为了进一步证明我们建议的方法的鲁棒性,我们的方法与基于方法的比较试验(35)进行评价数据及其平衡F-measure结果如图11。在理想条件下,基于时间的方法可以达到非常高的事件检测的准确性,如果时间戳可以正确地识别。然而,根据我们的实验在篮球和足球比赛,上述优势不明显(图11 (b)甚至的(图(11日))。这个结果可以解释来自两个方面:第一,时间戳不能总是强劲,认出位于实际噪声广播视频,影响事件位置精度的基于时间的方法;第二,篮球比赛有很多时钟停顿,使基于方法混淆事件段在此期间来定位准确。至于低检测该方法的准确性在足球比赛,主要引起的性能下降时,序列匹配算法应用于两个序列长度有明显区别(多个远射比单一事件)shot-level序列匹配。

7.2。定制个性化的视频

之前我们给个性化定制视频的实验结果,我们首先提到的可调参数的设置事件重要性计算。我们可以看到从(6)和(7), 是控制系数来决定事件级别和发生时间事件的影响重要性计算。在以下的实验中,这两个系数设置 ,这意味着事件级别和发生时间完全影响事件的语义意义。此外,可调整的参数 在(8)被设置为 ,表示平等权重为事件类型和涉及的球员。至于偏好的学习,不断的获得和设置阻尼 分别暗示概念的偏好程度应该逐渐增加或减少。基于这个概念网络, 函数中使用(8)计算如下: 在哪里 分别代表了语义事件和用户请求 表示语义上下文之间的相似性 在社交网络的概念, 概念是定制的, 概念是包含在 。“直接连接”是指 播放器或事件类型是一致的,和“间接连接”是指概念 不包含在 但间接与 网络的概念。至于“无连接”情况下,无论是直接还是间接关系可以找到

由于内在主体性的个性化视频定制,我们进行用户研究来评估我们的定制系统的性能。我们的研究涉及 志愿者都是第一次的用户定制系统和有一定了解篮球和足球比赛。为每个用户在观看 综合匹配,他/她被要求使用这个系统来定制自己喜欢的视频剪辑与各种个性化的偏好,比如球员,事件和时间,在不同融合参数。

验证的有效性提出了个性化定制算法,一个特别设计的问卷分发给参与者得到他们的反馈生成的视频内容。出于工作(46),我们定义了一个新的“3 c”标准的问卷如下:

(1)一致性
生成的视频是否符合用户请求内容语义,如涉及球员和事件类型。

(2)简洁性
是否生成的视频捕捉比赛的主体不包括无关紧要的事件。

(3)报道
生成的视频是否涵盖所有重要事件发生在比赛中在当前浏览时间限制。

以上三个指标需要回答五程度上李克特量表(47), 表示强烈反对, 拒绝, 勉强接受, 接受, 强烈的接受。

从图可以看出12当融合参数 增加从 ,普通用户评价结果一致性逐渐下降 。同时,评价结果表现在相反的报道,从 。这种对比,揭示了重要的作用 在平衡游戏内容和用户偏好定制过程的视频。当 小,算法将更强调用户的要求,因此选择更多的语义相关的事件。相反,当 大,等于说 ,结果在很大程度上是全球匹配状态,从而提出了有趣的事件。表6列出了定制结果在不同融合参数在响应用户请求”选择 秒突出对纳什的枪击事件在2008年第一季度NBA太阳与雄鹿”。如表所示,选中的部分是高度相关的用户请求时 等于 。作为 正在增长的 定制的视频剪辑,逐步改变到其他更重要的枪击事件结束比赛。在这些情况下,用户请求并不严格遵守,紧随其后,例如,涉及的球员。


ID 时刻 球员 事件 持续时间(s)

0.1 45 史蒂夫-纳什 三个点
33 史蒂夫-纳什 上篮
11 史蒂夫-纳什 跳投

0.5 54 格兰特·希尔 三个点
45 史蒂夫-纳什 三个点
33 史蒂夫-纳什 上篮

0.9 54 格兰特·希尔 三个点
45 史蒂夫-纳什 三个点
50 查理-维拉纽瓦 跳投

7.3。系统适应性

在本节中,我们调查是否该系统能够自适应地获取用户的个性化偏好定制过程。为方便评估结果,一系列预选的概念,包括球员和事件,给用户,这样他们就可以关注这些语义在他们下面的操作。每个用户分配一个体育比赛 强调概念,要求该系统使用一个或两个小时,唤起用户偏好倾向的过程。经过大约50轮交互,我们按照他们的偏好权重的概念,和列表的排名排序序列预选的概念。正确测量系统的学习能力,我们采用的平均精度(美联社)指数用于信息检索客观地描述系统与用户交互的学习能力。

78在球员显示实验结果得知用户的偏好和事件概念在足球和篮球比赛。在两个表,每一行对应一个用户偏好的学习在一个匹配结果,和每个单元的核心部分充满了一个强调概念名称和三组,标记为(#,# R1, R2),在#,# R1和R2表示概念查询频率和它的最终排名,没有基于网络传播的偏好。同样,美联社结果对应于每一场比赛是一对数字,标记为(# AP1, # AP2),代表的美联社结果定制系统,没有网络分析概念。表中爆发的细胞7作为一个例子,用户预先选择最有趣的球员“电”。后 查询关键字,导出权重排名 分别和美联社结果四个预选的概念有关 分别对应和不使用概念网络的学习算法。


用户 球员概念学习结果(3个足球,2个篮球比赛)
美联社

1号 齐达内 托蒂 亨利 皮耶罗
2号 梅西 冈萨雷斯 施魏因施泰格 巴拉克
3号 齐达内 罗纳尔多 小罗 卡洛斯

4号 Redd计划 纳什 博古特
5号 科比 加索尔 奥多姆


用户 事件概念学习结果(3个足球,2个篮球比赛)
3日 美联社

6号 拍摄 任意球 角落里 红牌
7号 目标 拍摄 越位 黄牌
8号 犯规 角落里 黄牌 拍摄

9号 拍摄 犯规 偷来的 反弹
10号 拍摄 小姐 犯规

实验结果表明, 的概念和predecided球员 这些事件的概念被安置在学习概念的前4等级序列,没有概念社会网络分析(CSNA),分别。两者都反映了该用户偏好学习算法的有效性,尤其是网络传播策略的偏好。球员概念学习的表7,CSNA行为更有效地比篮球比赛,足球比赛,主要是由于球员背景的差异。具体来说,所选的足球运动员是高度连接在袭击事件比篮球运动员(因为篮球运动员通常在比赛中参与防御和进攻的双重事件),因此更容易提出CSNA算法来定位这些足球前锋比篮球比赛。类似的解释也可以应用于事件学习结果表8。总之,该用户偏好学习算法可以有效地获取用户偏好的定制业务,和概念网络分析进一步提高了系统性能,特别是当用户需求是固定的和指定的。

8。结论

视频个性化是一个重要的机制来提供特定的观众与他们最喜欢的内容。考虑到不同的内容偏好和环境限制,详细的视频语义应充分挖掘和合理的评估,以便适合特定用户的视频片段可以被收集。这是一个具有挑战性的任务,其难度体现在每个子模块包括视频注释,个性化定制和系统适应性。

在本文中,我们提出了一个完整的框架定制个性化的体育视频。离线注释,分层视频文字匹配方法提高到使多媒体信息根据他们的语义对应,生成精炼和准确的视频内容描述。0/1在网上定制,user-participant多约束背包模型提出了实现语义内容检索和在资源有限的条件下总结。促进上述在线定制过程,基于概念网络的系统适应算法目的是隐式地推断出完整的用户偏好。

方法的复杂性关注语义视频注释。与简单的web-text分析相比,密集的视频处理,例如,相机运动估计和回放镜头检测,成本计算的大部分资源。此外,由于语法匹配算法需要积分的视频和文本序列作为输入,校准结果不出来,除非整个比赛结束了。由于这些原因,视频注释以离线的方式在我们的方法执行。然而,一旦语义注释,视频定制和系统适应性调整重量(概念)只涉及一些数学计算,从而可以实现实时处理。超过两个定量和定性实验 分钟的体育视频验证该方法的有效性。

另一点需要解决的可扩展性提出框架。由于在线定制和适应与特定运动类型无关,可扩展性主要是视频注释。虽然我们的工作是实现在球场上运动,喜欢足球和篮球,我们认为语义匹配的基本思想和框架一般可以很容易地适应其他对手运动。证据支持我们的思想来自两个方面:第一,现在住铸造文本是一个标准的服务在著名的体育网站,比如ESPN和BBC,涵盖大多数流行体育类型在我们的日常生活中。因此,没有缺乏体育视频注释文本描述。第二,“攻击”的概念存在于大多数对手运动和有非常明确的语义,因此其健壮的检测在其他体育类型也是可行的(虽然不可能一模一样我们当前的足球和篮球比赛的方法)。因此,通过一些必要的修改根据特定环境,语义匹配的基本框架仍然可以应用于其他运动流派。

在未来,我们打算改善目前的工作在理论和应用两方面。在语义视频注释,贝叶斯网络(BN)采用标签的语义内容视频片段和序列匹配算法应用于视频和文本对齐标签序列。这种方法忽略了周边的时序依赖语义标记,从而可能影响最终的匹配精度。来弥补这个不足,更先进的连续模型,如隐马尔科夫模型(HMM)或动态贝叶斯网络(DBN),可以用来模拟文本促进视频注释,视频文字对齐方式可以被视为一个隐藏的状态推理问题和解决Veterbi-like推理算法。另一方面,视频个性化本文主要关注的是内容的选择。然而,作为一个实际系统,视频编码和解码等问题在不同的沟通渠道和视频显示在各种设备上也具有十分重要的意义。对于最终用户来说,视频内容选择、数据传输、终端显示构成一个完整的解决方案定制个性化的视频。

承认

这项工作是由中国自然科学基金会(不支持。90920303)。

引用

  1. y鲁伊·a·古普塔,a . Acero“自动提取突出了棒球节目,”诉讼的ACM国际多媒体会议和展览,页105 - 115年,洛杉矶,加州,美国,2000年。视图:谷歌学术搜索
  2. m, n . c . Maddage c . s .徐m . s . Kakanhalli问:田,“创建音频关键字在足球视频事件检测”继续IEEE国际会议的多媒体和世博会(ICME ' 03),卷2,页281 - 284,巴尔的摩,医学博士,美国,2003年。视图:谷歌学术搜索
  3. z, r . Radhakrishnan a Divakaran, t . s .黄”音频事件检测基于突出提取从棒球,高尔夫和足球比赛在一个统一的框架中,“继续Acuoustics IEEE国际会议,演讲和信号处理(ICASSP ' 03)5卷,第635 - 632页,2003年4月,香港。视图:谷歌学术搜索
  4. L.-Y。段,m .徐,问:田”,在体育视频语义镜头分类媒体数据库的存储和检索卷,5021学报学报2003年1月,页300 - 313。视图:出版商的网站|谷歌学术搜索
  5. Y.-P。褐色,d . d .阿富汗二月,s . r . Kulkarni和p . j . Ramadge”快速的摄像机运动估计与应用程序视频压缩视频注释,“IEEE电路和系统视频技术,10卷,不。1,第146 - 133页,2000。视图:出版商的网站|谷歌学术搜索
  6. 张和S.-F。常,“棒球视频中的事件检测使用叠加字幕识别,”诉讼的ACM国际多媒体会议和展览Juan-les-Pins,页315 - 318年,法国,2002年12月。视图:谷歌学术搜索
  7. j . Assfalg m·贝尔蒂尼科伦坡,a . Del女人和w·Nunziati”足球视频的语义注释:自动亮点识别,”计算机视觉和图像理解,卷92,不。2 - 3、285 - 305年,2003页。视图:出版商的网站|谷歌学术搜索
  8. 郑伊健,a . m . Tekalp和r . Mehrotra“自动足球视频分析和总结,IEEE图像处理,12卷,不。7,796 - 807年,2003页。视图:出版商的网站|谷歌学术搜索
  9. 大卫和e·o·a . s . c . Eoel”事件在野外运动视频检测使用视听特性和支持向量机,”IEEE事务在电路和系统视频技术,15卷,不。10日,1225 - 1233年,2005页。视图:谷歌学术搜索
  10. C.-L。黄,H.-C。施,彭译葶。曹国伟:“足球视频的语义分析使用动态贝叶斯网络,”IEEE多媒体,8卷,不。4、749 - 760年,2006页。视图:出版商的网站|谷歌学术搜索
  11. l .兴问:你们w·张,问:黄,和h . Yu”计划拍体育视频分析的结合视听信息,”视觉通讯和图像处理卷,5960学报学报,第267 - 259页,2005年。视图:谷歌学术搜索
  12. L.-Y。段,m .徐,t·s·艾。蔡、问:田和c。徐”,中层表示框架语义体育视频分析”诉讼的ACM国际多媒体会议和展览美国加州伯克利,页33-44,2003。视图:谷歌学术搜索
  13. m, l .段c .徐m . Kankanhalli问:田,“使用多模在篮球视频事件检测,”环太平洋地区IEEE会议进行多媒体(PCM ' 03),3卷,第1530 - 1526页,2003年12月,新加坡。视图:谷歌学术搜索
  14. k .广域网和c .徐”高效的多通道特性自动足球突出的一代,”模式识别国际会议(ICPR ' 04),3卷,第976 - 973页,剑桥,英国,2004年8月。视图:谷歌学术搜索
  15. m . h . Kolekar和美国森古普塔为通用的体育视频分类层次框架,”第七届亚洲会议程序计算机视觉(ACCV 06年)卷,3852在计算机科学的课堂讲稿施普林格,页633 - 642年,海得拉巴,印度,2006年1月。视图:出版商的网站|谷歌学术搜索
  16. m .徐L.-Y。段,c。徐,问:田”,视觉和听觉的融合方案模式在体育视频事件检测”诉讼IEEE国际会议音响、演讲和信号处理(ICASSP ' 03),3卷,页189 - 192,香港,2003年。视图:谷歌学术搜索
  17. m·汉w·华、w .徐和y锣,”一个集成的棒球消化系统使用最大熵方法,”诉讼的ACM国际多媒体会议和展览Juan-les-Pins,页347 - 350年,法国,2002年12月。视图:谷歌学术搜索
  18. 基于m . h . Kolekar和美国森古普塔Event-importance定制和自动板球突出的一代,”《IEEE国际会议多媒体和世博会(ICME 06年)2006年7月,页1617 - 1620。视图:出版商的网站|谷歌学术搜索
  19. c·荣格和j·金”的玩家信息提取的语义注释高尔夫视频,”IEEE广播,55卷,不。1,第83 - 79页,2009。视图:出版商的网站|谷歌学术搜索
  20. n . Babaguchi y Kawai, t . Kitahashi”基于事件的索引播放体育视频的联运合作,”IEEE多媒体,4卷,不。1,第75 - 68页,2002。视图:出版商的网站|谷歌学术搜索
  21. h .徐和t·s·艾。蔡,“视听特性和外部知识的融合在团队运动视频事件检测,”学报第六届ACM SIGMM国际研讨会上多媒体信息检索(MIR 04年),页127 - 134,纽约,纽约,美国,2004年10月。视图:谷歌学术搜索
  22. k . c . s .徐j . Wang Wan, y,和l .段“体育赛事检测基于直播视频和16文本”学报》第14届ACM国际会议多媒体06年(毫米)圣芭芭拉分校,页221 - 230年,加州,美国,2006年10月。视图:出版商的网站|谷歌学术搜索
  23. d . Tjondronegoro Y.-P。陈平,范教授,“整合强调了更完整的体育视频摘要,“IEEE多媒体,11卷,不。4,22-37,2004页。视图:出版商的网站|谷歌学术搜索
  24. a郑伊健和a . m . Tekalp”通用play-break事件检测总结和层次体育视频分析”《IEEE国际多媒体会议及博览会(ICME ' 03),1卷,页167 - 172,巴尔的摩,医学博士,美国,2003年7月。视图:谷歌学术搜索
  25. m .别的和d·罗伊,”位于对体育视频检索模型的意义,”人类语言技术的进展:北美协会的年度会议上对计算语言学(停止/ NAACL ' 07),页37-44,罗切斯特,纽约,美国,2007年4月。视图:谷歌学术搜索
  26. n . Babaguchi k Ohara, t . Ogura”学习个人偏好从观众的浏览和操作应用到棒球视频检索和自动摘要),“IEEE多媒体,9卷,不。5,1016 - 1025年,2007页。视图:出版商的网站|谷歌学术搜索
  27. w·高,Q.-M。黄和张平,江树群”体育视频摘要和适应应用程序在移动通信中,“浙江大学学报:自然科学,7卷,不。5,819 - 829年,2006页。视图:出版商的网站|谷歌学术搜索
  28. y (s . m . Bhandarkar和k·李,“视频个性化多媒体资源受限的环境中,”诉讼的ACM国际多媒体会议和展览奥格斯堡,页902 - 911年,德国,2007年9月。视图:出版商的网站|谷歌学术搜索
  29. b . l .曾c . y .林和j . r .史密斯,”无处不在的移动设备,视频摘要和个性化”媒体数据库的存储和检索卷,4676学报学报,第370 - 359页,2002年。视图:出版商的网站|谷歌学术搜索
  30. y张x张、徐c和h . Lu“个性化检索体育视频”学报》国际研讨会上多媒体信息检索(MIR ' 07)奥格斯堡,页313 - 322年,德国,2007年9月。视图:出版商的网站|谷歌学术搜索
  31. a·阿米尔·m·伯格,h .排列,“互相关性反馈多通道视频检索查询公式,”学报》国际研讨会上多媒体信息检索(MIR 05)2005年11月,页17-24、新加坡、。视图:谷歌学术搜索
  32. t . Syeda-Mahmood和d . Ponceleon学习视频浏览行为及其应用生成的视频预览”学报》第九届ACM国际会议多媒体(毫米' 01),页119 - 128,渥太华,加拿大,2001年9月。视图:谷歌学术搜索
  33. j·齐默尔曼,k . Kurapati a . l . Buczak d·谢弗滴,和j·马蒂诺,“电视个性化系统:设计一个电视节目推荐引擎和接口,”个性化的数字电视:针对项目个人观众页,27-51 Kluwer学术出版商,多德雷赫特,荷兰,2004年。视图:谷歌学术搜索
  34. a . jaime n·d·Gatica-Perez,“以人为中心的计算:多媒体的角度来看,”学报》第14届ACM国际会议多媒体06年(毫米)圣芭芭拉分校,页855 - 864年,加州,美国,2006年9月。视图:出版商的网站|谷歌学术搜索
  35. c .徐j . j . Wang h .问:陆,和y . f .张,“小说框架语义注释和个性化检索体育视频中,“IEEE多媒体,10卷,不。3、421 - 436年,2008页。视图:出版商的网站|谷歌学术搜索
  36. c .梁,y, c . s .徐j .问:小王和h .问:,“层次semanticsmatching方法体育视频注释,”第十届环太平洋学报》多媒体会议(PCM ' 09)卷,5879在计算机科学的课堂讲稿,页684 - 696年,曼谷,泰国,2009年12月。视图:谷歌学术搜索
  37. m . l . Wang卢,g .徐”进攻时间分割在足球视频事件检测为基础,”学报第六届ACM SIGMM国际研讨会上多媒体信息检索(MIR 04年),页259 - 266,纽约,纽约,美国,2004年10月。视图:谷歌学术搜索
  38. f . Dufaux j·康拉德,“高效、健壮、快速全局运动估计视频编码”IEEE图像处理,9卷,不。3、497 - 501年,2000页。视图:出版商的网站|谷歌学术搜索
  39. c .徐张y . f, g .朱y y鲁伊,h .问:陆,和黄问:m .,“使用网络直播文本在广播体育视频语义事件检测,”IEEE事务在多媒体,10卷,不。7,1342 - 1355年,2008页。视图:谷歌学术搜索
  40. s . b .裁缝和c·d·温斯迟”,一般方法适用于寻找相似的两种蛋白质的氨基酸序列,”分子生物学杂志,48卷,不。3、443 - 453年,1970页。视图:谷歌学术搜索
  41. t . n . Babaguchi y Kawai Ogura, t . Kitahashi“个性化的抽象播放美式足球视频通过强调选择”IEEE多媒体》第六卷,没有。4、575 - 586年,2004页。视图:出版商的网站|谷歌学术搜索
  42. b . Merialdo k·t·李,d . Luparello和j . Roudaire”自动个性化的电视新闻节目,建设”ACM国际多媒体会议的程序,页323 - 331,奥兰多,佛罗里达州,美国,1999年10月。视图:谷歌学术搜索
  43. j·斯科特,社会网络分析:一个手册圣人,纽伯里公园,加利福尼亚州,美国,1991年。
  44. 彭译葶。翁,W.-T。楚,J.-L。吴,“RoleNet:电影分析从社会网络的角度来看,“IEEE多媒体,11卷,不。2、256 - 271年,2009页。视图:出版商的网站|谷歌学术搜索
  45. a . Vinciarelli和美国Favre广播新闻分割使用社会网络分析和隐马尔可夫模型,”诉讼的ACM国际多媒体会议和展览奥格斯堡,页261 - 264年,德国,2007年9月。视图:出版商的网站|谷歌学术搜索
  46. l .他大肠Sanocki, a·古普塔和j . Grudin“Auto-summarization视听传播的演讲,”诉讼的ACM国际多媒体会议和展览,页489 - 498,奥兰多,佛罗里达州,美国,1999年10月。视图:谷歌学术搜索
  47. r .李克特”态度的测量技术,心理档案,22卷,不。140年,1-55,1932页。视图:谷歌学术搜索

版权©2010梁曹国伟等。这是一个开放分布式下文章 知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。


更多相关文章

PDF 下载引用 引用
下载其他格式更多的
订单打印副本订单
的观点1332年
下载899年
引用

相关文章

文章奖:2020年杰出的研究贡献,选择由我们的首席编辑。获奖的文章阅读