国际期刊的数字多媒体广播

PDF
国际期刊的数字多媒体广播/2008年/文章

研究文章|开放获取

体积 2008年 |文章的ID 250654年 | https://doi.org/10.1155/2008/250654

c . e . Vegiris k . a . Avdelidis c . a . Dimoulas g . v . Papanikolaou, 使用高清电视直播高清视听内容通过宽带IP网络”,国际期刊的数字多媒体广播, 卷。2008年, 文章的ID250654年, 18 页面, 2008年 https://doi.org/10.1155/2008/250654

使用高清电视直播高清视听内容通过宽带IP网络

学术编辑器:托马斯Magedanz
收到了 08年4月2008年
修改后的 07年8月2008年
接受 2008年11月05
发表 2009年2月01

文摘

当前论文着重于验证的实现先进的视听(AV)技术设置直播的文化节目,通过宽带互联网。这项工作的主要目的是研究中,配置和设置专门的音像设备捕获的过程,处理和传输的扩展分辨率和高保真AV内容以增加现实主义和获得最大的观众感觉。Internet2和GEANT宽带通信网络被选为最适用的技术交付这样的交通工作负载。验证过程进行结合基于指标的服务质量(QoS)和质量的经验(体验质量)评价实验的量化和知觉解释质量实现内容复制。实现的系统成功应用在真实的应用程序中,如文化活动的传播在希腊塞萨洛尼基音乐厅以及费城管弦乐团演出的繁殖(美国)通过Internet2和GEANT骨干。

1。介绍

毋庸置疑,下一代网络和宽带接入的快速进化新兴现在增加影响传统信息和通讯技术(ICT)的服务和应用程序。其中,数字多媒体制作和广播主要是受到这些变化的影响,允许充分利用现代技术的进步。小说,面向用户,按需服务目前部署的浏览、搜索和检索的AV内容,包括新闻在内的多媒体电子学习、AV流的文化活动,娱乐节目,和其他应用程序。网络视频点播(VoD)服务,数字/互动电视(数字电视/ ITV),基于ip电视(IPTV)计划在互联网和移动系统是典型例子AV内容通常是通过基于ip的拓扑(1- - - - - -7]。这也符合需求的持续不断扩展可用的AV内容分辨率和保真度,以达到更好的体验,创造一种现实主义或远程监控8- - - - - -19]。高清晰度(HD) AV技术(5- - - - - -7,9,10)、超高清晰度视频(UHDV或超高清)(17- - - - - -19,数字影院(d电影)20.)项目目前专注于这些目标,增加相关的视频流的容量,提高强制要求更高的数据传输速率。除了实用程序,最近推出的下一代网络体系结构(1- - - - - -3),宽带服务和高清晰度多媒体广播是一个非常具有挑战性的技术/研究领域,目前论文旨在讨论的深度。

万维网的广泛和成功实现的知识通过互联网已经导致全球采用IP技术和基于IP的通信在当代的一大片区域内ICT服务。有一个全球努力构建宽带网络骨干,像Internet2 [21)和Geant (22)计划已经实现在过去10年在美国和欧洲,分别。很明显,数字多媒体广播本质上属于要求宽带服务,如上述以及类似的先进的技术方法(8- - - - - -10,21,22]。当前论文的目的是分析,实现,和评估的使用先进的数字多媒体广播技术结合宽带服务要求AV流的传播,通过捕获性能高清电视直播。拟议的AV配置设置已成功部署在真实的应用程序中,如文化活动的传播从在希腊塞萨洛尼基音乐厅23)以及费城管弦乐团演出的繁殖(美国)(24通过Internet2和GEANT骨干)。然而,提出的方法可以进一步利用指导相关IPTV应用程序,尤其是处理高清视频/多媒体流。

本文组织如下。问题定义中描述的部分2,国家的研究和相关工作进行了讨论。部分3提出了系统配置,提供详细信息的开发步骤工作,所有的物理和技术方面面临在实施阶段,而指标的统计/关系及其利用率也会考虑。实验结果进行了分析4,评估采用的系统配置进行结合的结论和未来的工作的话。

2。问题定义和背景的工作

网络多媒体应用程序的日益流行创造了新的要求可靠和安全的视频传输,所以AV内容预计将占很大一部分交通在未来互联网和下一代无线系统(8,25,26]。这为宽带网络提供了更多的必需品由于数字音频和视频保存大量的信息,特别是在关键/要求情况下,而高分辨率是必需的,而质量妥协是不能接受的。满足这样的要求,先进的压缩技术不断发展与小说相结合的路由体系结构和算法,以保证所需的QoS通过当前可用的网络数据传输速率(8- - - - - -10,25,27,28]。经典的例子,这一类是IPTV和VoD项目切开在过去的年1- - - - - -7]。因此,各种研究已经出现关注网络的评价和压缩参数,结合各种内容类型,使用定量指标(通常是感知调整)以及科目合并功能,感知,审美的意思是意见分数(苔藓)[8,27- - - - - -35]。最近,研究工作已经开始关注HDTV-related方法(5- - - - - -7,9,10,33,34),包括d电影(20.]和UHDV [16- - - - - -19,36),针对评估的优势,以及这些技术的技术难题,对未来的实现、AV广播服务。

当前论文的范围是双重的:首先,提供一个坚实的高清视频内容制作和传输的系统布局;第二,评估系统的各种参数配置设置效果实现的质量。提到当前纸是很重要的处理技术问题生产(物理剧院)和生殖(远程圆形剧场)阶段以及相关的所有中介阶段与内容包装和流(AV格式,压缩算法、路由架构,等等)。因此,与前面提到的研究,它旨在提供端到端解决方案及其评价成功的广播在礼堂现场表演。此外,音频和环绕声技术是至关重要的成功成就“高保真”目标。因此,与视频和值得audio-related问题是同样重要的,分别录音精心治疗,混合、多路复用、编码和繁殖过程。正在研究具体来说,问题是最好的描述应该常提出的问题回答。有多少摄像机和应该采用什么格式?多少个麦克风,什么类型,应放置在哪里?AV压缩、多路复用和编码算法应该选择?是最适用的AV内容应该实现包装/流媒体技术,结合现有的网络拓扑结构和相应的路由架构?有专用的AV设备实现再生产的要求,以及应该如何使用?上面的参数如何影响实现质量和传输显示的看法吗?最外层的当前工作的目标是为生活提供指导AV捕获/ IP-broadcasting /繁殖以及集成方法预测/评估的实现,端到端体验质量( (即),使用QoS指标。,PSNR值)related to both application-demands ( )和广播网络层次( )。

大多数的相应的研究工作主要集中在video-related问题,这在技术上是最苛刻的,因为他们是与更大的AV数据流的一部分。例如,ccd相机噪声和lighting-related退化的情况下可能会出现捕获条件不能调整基于广播的要求(8,37),作为观众的表演节目主要是指定在物理礼堂。一般来说,视频信号噪声可以在收购期间,记录,数字化、处理和传输37]。另一方面,音频信息需要仔细的治疗才能创造高保真声场繁殖条件。这个任务的重要性已经详尽分析了d电影和UHDV计划(13- - - - - -16,36),而各种立体声录音技术提出了结合相应的环绕声系统的有效实施[13- - - - - -16,36,38- - - - - -43]。从实用的角度来看,5.1和7.1环绕系统已经在现实的应用程序中,如电影院和电影行业。此外,主观测试应用提供最佳格式选择指南,结合相应的内容类型和可用的繁殖高清电视机(33,34),而未来趋势的高清电视和第三代高清电视格式,像1080 p,研究了(9,10,34]。然而,在高清电视的情况下,一些学者注意到陪同环绕声结合观看距离条件(9,11]。

考虑到视频compression-related退化研究在开发相应的算法,许多研究人员只关注视频广播的评估过程,研究了生成的交通需求与相关网络技术的特点(8,25,26]。一般来说,有三个主要的研究方法在评估广播网络video-wise: (a)实际视频bitrate-based技术,(b)视频traces-based方法,和基于模型(c)技术(26,29日- - - - - -35]。实际视频流展览创意并提供准确的结果评价在有损网络传播,但提高困难与他们的可用性和版权的权限。为了克服这些问题,视频跟踪仅使用视频内容的比特数和相关的计时信息视频内容本身(而不是26,29日,30.]。这些技术重点研究传播特征但无法估计其影响解码过程无法预测发生错误反思如何接收到的图像序列的感觉(26,29日,30.]。上面的一个进化的方法包括设计先进的视频跟踪,包括各种video-related特性(30.),使丢包影响压缩序列的研究(28,29日]。最后,基于模型的视频流量技术用数学模型来描述视频在网络上传播,强烈依赖的有效性选择模型在现实的应用程序中(26,29日,30.]。这些方法是最简单的评价方法在像素的水平,提供统计数据丢失帧,和组的照片(共和党),在不同的网络带宽和拓扑结构,不同的路由体系结构,一般来说,变量的QoS设置(8,25,26]。

正如我们已经提到的,包丢失信息估计实际视频退化不足,相关的接收和感知图像质量。在大多数情况下,引用内容可用(全部参考(FR)方法(26,29日,30.]),因此对比播放(引用)和接收到的AV流用来形成相应的指标。峰值信噪比(PSNR)和均方误差(MSE)是最常见的算术指标通常用于客观评价的图像和视频(即“加工”。压缩的过程,增强去噪、传输等)(8,25- - - - - -32,37), 在哪里 参考和受损的视频帧(即相应的视频组件。,亮度分量 ,颜色组件 , 等), 笛卡尔image-coordinates, 帧数, 是最大值的2 d信号相关的量化比特数 (等于255的8位图像信号), 水平和垂直图像分辨率,分别8,32,37]。

尽管PSNR值指标是完全可接受的最终信号完整性的评估,它不是能够评估视频退化引起的结构不同。非常简单和计算负担得起的“度量应用,广泛用于这个任务是perceptually-adapted结构相似度(SSIM)指标(31日]提取基于人类视觉系统(HVS)的一般原则是高度敏感的结构信息接收的光刺激。因此,考虑再次引用和受损的信号(视频帧) 一个简化的形式估计SSIM给出如下(31日]: 在哪里 已知统计(意思是,标准偏差,cross-variance),然后呢 小正的常数时,介绍了防止计算溢出和不稳定值非常接近于零。

除了FR方法和相应的指标(PSNR、MSE、SSIM) reduced-reference (RR)和不使用参考(NR)方法,当源(引用)内容是在评价过程中部分可用或不可用29日- - - - - -31日]。这两种方法是常用的结合主观测试依赖于金属氧化物半导体统计为了充分结合HVS的感知属性在评估。此外,主观测试非常有用的情况下,各种参数的影响不是预先确定的,或取决于AV内容本身的特点(即。,degradations at the acquisition/digitization phases, impact of packet losses at the decompression phase, appearance of errors and concealed errors with respect to image position and motion activity of the content, impact of the selected resolution—scanning to the perceived quality with regard to content type, etc.) [25- - - - - -31日]。

我们所知,没有足够的指导和相关信息在现实世界,使用先进的视听的端到端实现高清设备上面的特点,除了在前面的段落讨论的研究成果和演示的部分重点讨论的一些目标。在当前论文范围、统计分析使用FR和NR执行方法,使用标准的质量指标和测试混合评价函数对现实世界的广播和模拟传输高清流。

3所示。该系统配置

高清视频和环绕立体声是最可行的选择以满足应用程序的最低配置要求。此外,对当前工作的具体要求,以便使用要求在实际应用中,应考虑各种实际问题。

3.1。物理和技术问题:应用需求和技术需求

为了解决上面的案例中,有一个需要复制的条件在实际事件地点一个潜在的虚拟事件地点。考虑到比例,适当配置投影大厅在远程站点可以作为虚拟礼堂后一定规范。幸运的是,高速互联网和数字技术的增长在过去几年给我们提供一个独特的机会,把所有的上述数字形式后合适的标准和实时传输的内容甚至最偏远的观众,满足实际的文化活动的独特性和动力需求。在上面的框架,我们的研究是针对调查实际场地的条件,传输基础设施,和虚拟场所的各种因素如实际观众感知、采集、传输、复制、等等。体系结构的概述如图1(一),而AV捕获/生殖在人物设置了1(b)和1分别(c)(详细信息选择的体系结构提供了设置下面的段落)。

3.1.1。捕获性能的物理剧场:网站传播

第一个问题出现在这样的一个系统的设计观念的研究,因此观众在演出大厅的经验(礼堂,音乐会,歌剧,等等)。考虑到实际的性能被关押在一个有组织的大厅,我们理所当然的声学和视觉的完整性。因此,观众“甜蜜点”的存在,在不同情况下。因此,如果一个是决定一个旁观者的位置的经验参考,选择一个合适的将其中一个景点的选择方面的音频和视频刺激(23,42,43]。我们的努力是针对选定的实际观众位置的转移经验的所有成员远程观众(23]。

在这一点上,它是有用的区分音频和视频捕捉属性。音频而言,感知到的结果在一个实际的大厅是由下列因素的组合:(a)直接声场,(b)混响声场(大厅音响),和(c)由广播系统,如果任何安装(42,43]。生殖系统的远程大厅被指定为一个标准的5.1环绕系统,如今,是典型的音响系统安装在大多数公共投影大厅(即。、电影院)。为了能有效地再现原始音频的条件,这是至关重要的收购上述领域尽可能分离混合,使最终的5.1对应参考位置的经验。因此两种同时使用麦克风设置:(a)枪麦克风阵列指向的阶段直接字段和(b) soundfield麦克风的参考位置空间通过四个声音信息 音频组件(40- - - - - -43),用于提取实际观众感知周围(图1(b))。

自从与延迟直接字段到观众与舞台的距离成正比,上面的设置能够提供直接字段和混响/ PA字段位置的问题(42,43]。根据(42,43),这样的一个混合动力系统能够提供soundfield本地化、虚拟源positioning-panning和信号增强,通过振幅加权和时间延迟补偿,尤其是对小型来源(点源模型)的情况下,甚至还来源。尽管这些条件是最有效的文化表演处理(即在当前项目。,jazz, theatrical acts, recitals, etc.), we decided not to involve sound-source localization for practical reasons as well as in order to propose a universal recording layout that could be applied in every cultural show. However, we adopted the amplitude—delay weighting approach, aiming at capturing and reproducing the audience experience related with the hall acoustic properties of the physical theatre. Based on the above remarks, the gun microphone array signals and the corresponding soundfield components were mixed to a 5.1 setup based on sound propagation criteria (amplitude-phase weighting) according to their positioning and the coordinates of the capturing (camera) spot [44]。

至于六声道的编码必须传播而言,一个AC3编码器,320年创建了一个流kbits / s,实现一个容易可解码,消费者方面的高质量音频的形式(23]。这是DVB格式所使用的编码,因此,没有进一步检查,因为质量证明提供了(45]。

视频的情况下更简单的作为一个旁观者的角度在这种环境中受到可见领域视角和选择阶段的边界位置。在这种情况下,最重要的一点是,观众可以关注他/她注意任何时候在任何时间在舞台上的表现。为了实现这种感觉在遥远的大厅,有必要提供完整的虚拟观众阶段看来,至少在足够的质量和near-to-real维度。选择视频捕捉设备(高清摄像头)覆盖舞台区在一个稳定的位置,以便转移一个公正的舞台方面的干预(没有导演)在虚拟观众(23]。实际中使用的设置地点如图1(b)。

准确的捕获位置,这意味着距离舞台和相机的高度,必须决定。具体来说,收购点的确定很大程度上取决于阶段的物理尺寸(宽度和高度)。此外,必须特别注意的技术问题,如相机镜头的焦距和缩放,以避免畸形由于变焦镜头。在任何情况下,前者应该配置设置的参数根据剧院舞台和座位的限制和局限性的布局和它在每一个不同的物理剧院是不同的。

另一种策略,对于视听(文化)显示的实时传输,是采用多个摄像机董事设置视频和音频混合5.1独立大厅的声学特性,是目前持有的费城交响乐团与全球演唱会(24]。这两种策略可以共享相同的配置设置关于AV广播,然而有重大差异捕捉甚至繁殖布局,相关问题,实现体验质量产生影响,因为它将进一步评论4

视听框架的决定实际上是最重要的一部分设计。我使用的视频格式最终是1080;然而,720 p的格式也进行测试。这个选择的主要原因涉及的成本和消费者方面投射能力。本机协议在生产方面使用HD-SDI标准为了消除传输前的质量损失(23]。mpeg - 2压缩是基于视觉内容的事实很容易解码,提供足够的视频质量问题下的场景。调查的时候,有各种各样的mpeg - 2启用设备(编码器、解码器)在市场上大量的时间,确保了该方法的可靠性。此外,相对较低的带宽要求,这样的任务能够保证可靠传输(考虑到互联网框架下面讨论)。比特率的选择是基于主观、客观、实证标准和密切相关的性质传播材料(更彻底的分析提出了部分3.1。2)[5,7,9,10]。

其他实现选择包括决策相关的前向纠错(ProMPEG选举委员会),变量/恒定比特率编码,和共和党结构。大多数的这些参数是根据ITU(考试46]相对于过去的研究作品的加工内容(33,34),考虑到同样的限制传输网络。基于运动缓慢传播的本质内容,最终决定包括使用高水平的主要配置文件(MP@HL) [23格式的mpeg - 2编码,CBR模式,缺乏纠错成本更低,最容易实现。

3.1.2。繁殖在远程礼堂:接待场所

根据录音布局已经讨论过的,很容易描述相应的必需品在远程礼堂。事实上,一个标准的5.1环绕系统设置只需要(图1(c)),而应该发生轻微变化相关的尺寸远程礼堂和足够数量的喇叭。在任何情况下,中性声大厅行为(低混响)是首选,允许传输的物理剧院声学经验更忠诚。甜点,在这样的环境中,也主要是基于定义音频质量叠加的条件每个投影大厅。

视频部分,是相对于投影的大小所造成的限制。最大程度的现实主义的成功,事件应该显示投影的投影物体的物理尺寸。理想情况下,投影屏幕的大小应该匹配的尺寸物理剧院舞台,但这是不可能的远程礼堂。因此,屏幕尺寸应尽可能接近物理阶段,当然不应超过这些物理维度。屏幕尺寸和分辨率投影影响的视角传达完整的感觉存在的广角视频系统是80 - 100 arcdeg [11,12,17]。为了达到最好的观众观看体验,观看距离应大于最短的距离,一个人与正常视力1.0无法认识到屏幕上的像素结构(12]。然而,远程呈现的感觉是随着距离的增加而减少。上面的两个相互矛盾的标准之间的妥协,第一优先,并建议采用最佳观看体验(44]。

在远程端使用的标准投影变化根据HD-SDI之间的投影设备,DVI, XGA, HDMI由于mpeg - 2解码设备提供的多功能性。尽管有研究专注于高清格式的主观评价,结合投影屏幕的大小在平板电视机33,34),没有可用的出版作品关注大型礼堂投影。全面技术市场研究指出最适用的DLP技术的使用投影仪,在5米宽,结合电子投影屏幕。结果,三个可供选择的投影格式检查:720 p50 1080 i25,和1080 i29.94,最后一个应用在费城交响乐团的再生产传输(23,24]。

3.2。Av数据的传输和网络构造的要求

大部分的属性描述传输框架可以从视听框架规范。最后选择的选择包括MPEG TS封装使用RTP协议30 Mbps的速度流的比特率。这个选择是基于MPEG的TS可以封装同时AC3格式的音频流,消除了同步问题出现在过去的努力,并允许多声道环绕声的交付。最后,结合RTP引入了大量的抖动免疫力的消费者可以利用这一功能。同时,ProMPEG选举委员会的使用测试(23]。

如前所述,目前互联网属性在讨论动机的实现工作。后与GRNET密切协作,完成设置能够可靠地提供我们的服务相当数量的希腊省和城市大学,因此覆盖一个潜在的大量的观众。为了尽可能多的感兴趣的消费者服务,传输是决定通过一个多播组(23]。提供了传播网站建立连接通过一个M-BGP启用开关和一个端到端光千兆以太网上行GRNET骨干开关和铜线千兆以太网下行内部连接。大学校园内的接收端设置依赖于已经建立的铜线组成的网络基础设施的快速以太网墙壁插座认证功能和效率。链接测试传输/接收错误和被要求出现高质量的链接状态是一个相对容易的任务,因为我们解决本地组织网络(大学)而不是开放的公共(即。家庭用户)。传动箱,一个独立的IGMP启用时,使用mpeg - 2编码器/拖缆所需的接待情况下各自的接收器/译码器可以由一个独立的或基于pc的设置。在这两种情况下的多播流量由多播骨干(MBONE)基础设施的提供者(GRNET和大学国有石油公司)。一个会话公告通过SAP也可用静态传输期间为了鼓励参与我们的测试。上面的设置保证最小化物理层相关的腐败。

3.3。Qos和体验质量问题

服务质量是一个术语,主要用于网络应用程序描述在传输过程中数据的完整性,包括及时到达要求。正如前面提到的,在视频/广播应用程序我们可以区分两个连续的阶段,影响整体的QoS:应用QoS ( )和广播网络QoS ( )[47- - - - - -49]。这2段模型已广泛应用于相关的应用程序(47- - - - - -49),它还在实验阶段采用当前工作的广播仿真设置和统计分析(见图2)。具体来说,在应用程序级别,我们可以考虑比特率的影响(Mbps),输入格式(1080 i / 720 p),编码类型(CBR / VBR),内容运动活动[motionActivity],反交错和错误隐藏的策略 。网络广播级别而言, 是影响网络直接包损失,抖动,产生间接/二次包损失根据路由/流/缓冲/策略(缓冲区大小,UDP / RTP)。一般来说,QoS指标(Qsm)可能已经配置使用了FR指标PSNR / MSE(使用一个FR-metric或它们的组合)来评估视频质量在每个阶段。因此,考虑到之前我们可能形成简单的表达式来分析模型Qsm作为应用程序/广播的功能特点: 在哪里 , , 是涉及端到端、应用程序和广播QoS指标,分别n是播放视频序列帧的数量,然后呢 一般来说,复杂目标函数与输入自变量( var, var) QoS的估计。

正如我们已经提到的,视频、包丢失和PSNR值不能反映线性“视频质量”繁殖/ AV的投影播放内容,因为失去了像素可能或不可见,感知体验质量(通常有不同的影响29日,32,35,50]。为了能够占到收获的经验和体验质量模型,感知标准应考虑HVS有关。在上述背景下,最简单的规则来表达体验质量指标(Qem)作为输入参数的函数( var, var)是通过所有的 , , 指标通过一个过滤器,模拟HVS的行为来获取所需的 , , 。一种不同的方法将部署感知调整指标,如SSIM,甚至主观MOS的结果。因此,我们可能会取代Qsm和Qem QoS参数化的通用表达式Qm /体验质量的函数对应的应用程序和网络QoS /体验质量的估计 在哪里 又重要的参数功能控制的 var / var独立变量(输入)以前讨论的。根据(4 b),想要体验质量在当前方法是模型结果的函数( , )和( , )对,分别表示通过PSNR和SSIM。

让我们仔细检查(3),(4)和(4 b),试图预测Qm变化对输入变化。我们将假设QoS和体验质量与单调增加,所以Qsm提高(提高QoS)反映相对Qem增加(提高体验质量),反之亦然。因此,我们可能形式简单的规则来描述比特率的影响,格式(720 p / 1080 i)和运动活动内容 / 和抖动的影响 / 。很明显,随着比特率的增加, 更高也因为用更少的压缩工件获得更好的图像质量。另一个问题与比特率是内容本身。例如,AV流特性高视频运动活动,这使得编码过程更多的要求和复杂,所以视频退化加剧为了能够达到所需的带宽。另一方面,增加了比特率可能会导致 指标下降,因为包丢失和抖动的影响增加网络流量的需求正在上升。最后,很明显,随着抖动的增加 指标去更糟的是,因为间接丢包率更高。其余参数的感情并不认为是不太重要的当前应用程序的特定需求。例如,CBR / VBR变化没有测试,在此基础上,CBR更健壮和可靠的部署在宽带网络,而反交错和错误隐藏选项被排除在本研究为了简单起见(为了避免混淆使用太多的参数)。同样,由于直接包损失是不太常见的宽带网络,我们认为只有抖动的影响。路由策略而言,很明显,使用RTP优越在UDP(相关实验验证这种说法),所以,使用RTP决定作为固定选项。上述言论可能表达的形式化和以下方程: 的偏导数 表达每个独立变量的影响,考虑到所有其他的输入变量( var, var)保持不变。我们可以观察到一些上述的变化完全不同的部分系统响应的影响 ,所以没有很容易说上面的参数将获胜的决心端到端指标 在broadcasting-configuration非平凡和真实场景中,就像处理目前的工作。

运动相关的活动特点也使用交错(1080 i)或进步(720 p)扫描。例如,它会比高运动视频序列编码进步格式(即。720 p)为了避免过滤运动细节由于隔行扫描(以防1080)。虽然这些运动工件很烦人,他们很容易被研究对象/观众,FR-metrics PSNR和SSIM无法衡量这种限制是因为,这本身也存在于原始的源材料,用作参考。因此,再次一个参数的影响(隔行/进步)提供了有争议的影响整个系统的行为。提到的使用是很重要的720 p和1080我不是用于两种格式之间的直接比较,使用前面提到的FR-metrics,但是他们提出了替代源码内容选择确认他们都遵循一定的规则和姿势类似Qm依赖从剩下的独立变量( var, var)。

基于上述分析,评价程序使用仿真设置和实际联系视频传输根据布局图2

4所示。实验结果和讨论

后系统的设计和实现以及相关的方法论,多个应用程序涉及的组织进行了传输和招待会。实验包括传输等四个实际实时传输的塞萨洛尼基音乐厅(三个从门厅和一个大厅)。接收投影场馆在希腊成立于四个城市(雅典、塞萨洛尼基,佩特雷,和伊拉克里翁),一个在欧盟(爱尔兰都柏林)涉及共有七个虚拟大厅不同从非常小到中等大小。解码设备我们鼓励组织者建立最后是基于pc的解码器使用VLC媒体播放器,而硬件解码的情况下只是考验我们的团队。验收的观众很鼓励这种活动和所表达的是越来越多的观众和渴望继续提供更好的服务。

我们还测试了该方法通过虚拟大厅安排两个公共组织的预测全球演唱会,也考虑到此类事件的组织方面。几个促销行为被(电视宣传视频、海报、邀请函等)。为了刺激和衡量公众利益。事件后,观众被要求填写一份调查问卷来测量某些经验因素。类似的结果的收到自己的传输是很有希望的。更详尽的分析,给出了参数选择和实验。

4.1。通过基于指标的定量分析评价

之前NR定性评价,同时还启用了FR方法针对评估的视频通过metric-extracted客观量的退化问题。这个评估过程进行了只对视频内容由于音频编码/多路复用是基于一个经过良好测试的技术(AC-3)已成功实现45在过去的几十年。然而,评估新记录的布局是值得的,这就是为什么audio-related定性评价过程中的主观测试包括在内容复制在远程站点(s)(这个问题进一步分析在接下来的段落)。此外,更彻底地主观评价,结合定量分析,采用/定义适当的audio-metrics,目前计划。

它关注视频评估,未压缩高清视频内容(33,34,51)被选为参考材料要比收到/解压视频模拟远程站点。一般来说,评价过程必须进行根据以下变量:(一)内容类型,(b)压缩参数,(c)流参数和(d) / QoS路由设置。第一类内容分为两大类根据原始高清格式(1080年720 p, i)。五个子类为每个格式类型,形成基于涉及运动活动的内容,这意味着行动的速度33,34]。涉及“瑞典电视AB”(SVT)参考视频组已在过去使用了类似的评价HDTV-related应用程序(33,34),这是一个额外的理由选择丰富其是否适合当前应用程序的要求。10个不同的内容类型每个格式参考视频编辑分别和两个不同的视频剪辑制作,一个720 p序列和一个1080 i序列。每种内容类型曾三次在每一个序列和不同内容类型之间的灰色伴侣增加了2秒。五个不同的内容类型是排名的运动活动,它们包含了我们。他们规模从1和评分,1是一个包含最小的运动活动。

除了内容类型、压缩参数提供一个额外的变量决定了编码比特率。考虑到使用的mpeg - 2压缩,涉及三个不同的比特率是在模拟( , , ),这些值被选为推荐和用作参考从IPTV电联焦点小组23,25- - - - - -29日]。其他参数的压缩CBR与VBR、类型和长度的共和党已经声明没有进一步检查(23]。然而,网络层的不可避免的问题是在调查中为了平衡视频比特率的因素在抖动条件下/协议和质量。根据定义,抖动变化在旅行时间从发射机到接收机的恶化导致流质量尤其是同步的情况下敏感的多媒体应用等服务。也高度依赖一个分组交换网络拓扑的基础设施。因为在互联网框架网络的复杂性,因此涉及的抖动增加场地的地理距离增长,至关重要,调查这个因素在当前上下文。

至于流参数,选择协议(UDP与RTP)是唯一的变量涉及使用鉴于MPEG2-TS形成。RTP的优势很明显,最好的使用,只要这是可能的。然而,额外的缓冲存储器,RTP的存在意味着成本传输流比特率成正比,不能忽视。特别是在流的高比特率的情况下的传输,使用RTP的额外成本是很重要的,所以它应该是第二个,更昂贵的选择,UDP。自RTP实际上增加了一个预定义的免疫力的某些毫秒抖动,根据所使用的缓冲区大小,抖动影响RTP和UDP之间的关系可以表示由以下方程: 在哪里 分别是水平和垂直视频分辨率,bpp代表每像素位数,fps帧每秒,然后呢compression_ratio是原始的比值与压缩流的大小。由于上面,UDP的情况下,这可能是用于一般的结论,是检查。

网络性能模拟的思路(网络模拟器)模块(52)可完全参数化。网络延迟是在恒定的典型值50毫秒,因为它不影响单向传输质量除了一个常数的延迟。抖动的价值(延迟变异)作为控制变量使用的值 和0.12毫秒。因此,30种不同的模拟(2分辨率格式×3比特率×5抖动)必须实现,为了让所有可能的组合被记录下来。为此,15个不同的假设基准电路(hrc)被用来展示在表1


人权组织 比特率 抖动

1 15 Mbps 0
2 17 Mbps 0
3 18.1 Mbps 0
4 15 Mbps 0.05
5 17 Mbps 0.05
6 18.1 Mbps 0.05
7 15 Mbps 0.09
8 17 Mbps 0.09
9 18.1 Mbps 0.09
10 15 Mbps 0.11
11 17 Mbps 0.11
12 18.1 Mbps 0.11
13 15 Mbps 0.12
14 17 Mbps 0.12
15 18.1 Mbps 0.12

一个高性能的基于windows的个人电脑,配有HD-SDI视频卡和高数据传输速率条纹磁盘阵列作为球员打参考视频剪辑。基于linux PC与时代华纳模块安装使用的网络模拟器,最后捕捉投影视频是由另一个PC与第一个相似。做的编码和解码是泰德encoder-decoder系统中使用的所有传输标准。出于兼容性的原因,设置参考使用转换和编辑视频内容通过特别关心整个pretransmission过程中没有任何质量退化。使用的格式是未压缩的YUV 4:2:2 8位在AVI文件的容器。编码和传输视频信号必须编辑和转换成相同的格式,以便比较。编辑以来捕获的视频是强制性的录音软件,我们尝试都无法同步通过网络连接与回放系统。

视频信号传输的比较和评价了Semaca软件VQLab [53)可提取每个视频信号的PSNR和SSIM指标相比,参考视频。这两个指标提取一次视频退化( 人权组织)引起的端到端,使用引用原始视频和播放内容一次视频退化( )引起的网络使用参考后产生的视频编解码系统。后者是理想的视频信号编码和传输网络(抖动和丢包是零),所以它伴随着视频制作系统HRC 1, 2, 3为不同的编码比特率。

的建模 的函数 我们的目的是我们已经在部分3.3。提取的PSNR值和SSIM指标的人权组织1,2,3 ( ) 可以建模为比特率的函数。在图3介绍了实验数据的图表,可以看到他们的对数趋势。还使用了一个对数函数(49)标准定义视频SSIM造型,所以它可能会认为质量指标和比特率的关系可以被描述由以下方程在高清晰度的情况下: 通过我们的实验数据和Levenberg-Marquardt非线性曲线拟合的算法在虚拟仪器7.1中,我们计算这个函数的系数为每个不同的内容类型和两个指标。每个指标的两个方程如下: 模型没问题可以看到所有内容类型,因为它的意思是错误和它的标准差,它在桌子上2。每种内容类型的所有系数可以在桌子上3


720便士 1080年,我

SSIM PSNR值 SSIM PSNR值

运动活动 平均误差 错误性病 平均误差 错误性病 平均误差 错误性病 平均误差 错误性病

1 4.81265 e-9 0.00413522 2.18991 e-11 0.228754 4.73121 e-9 0.00648127 5.64537 e-9 0.32641
2 4.47919 e-9 0.0111251 4.70308 e-9 0.763141 4.13375 e-9 0.0135428 8.15997 e-9 0.967442
3 4.02524 e-9 0.00762155 1.12177 e-11 0.378139 3.49324 e-9 0.0121462 1.80827 e-8 0.373196
4 3.95311 e-9 0.0280775 1.19821 e-11 1.07011 3.34799 e-9 0.0333977 1.96567 e-8 1.00888
5 3.99949 e-9 0.0214723 1.22118 e-11 0.927963 3.16903 e-9 0.0377795 1.54833 e-8 1.10852

tabA1”src=
表3:系数的模型

相同的策略后, 可以建模从人权的PSNR和SSIM值测量6,9日,12日和15的函数使用人权组织的测量参考3抖动。基于观察到的对数衰减的读数,可以查看图4,最初是使用以下指数方程: 通过我们的实验数据前面提到的方法,我们计算这个函数的系数为每个不同的内容类型和两个指标。每个指标给出的两个方程如下: 上面的评价模型,通过考试的错误和标准偏差,表现出不良行为PSNR值的情况下,提供具体的证据模型数据不相容。然而,这个模型被证明是接受SSIM的情况下这两种情况下的720 p和1080 i。这些言论在桌子上很明显4。每种内容类型的所有系数可以在桌子上5


720便士 1080年,我

SSIM SSIM

运动活动 平均误差 错误性病 平均误差 错误性病

1 8.48932 e-13 0.0940386 1.06714 e-12 0.106202
2 3.39184 e-13 0.128918 2.24342 e-11 0.140298
3 5.36862 e-13 0.148489 1.01207 e-11 0.157717
4 1.4043 e-11 0.174185 4.34895 e-12 0.170075
5 1.26526 e-12 0.157883 2.00221 e-11 0.180327

tabA2”src=
表5:第一个模型的系数

为了克服上述模型的不稳定性在PSNR值的情况下,指数的线性混合模型进行了测试,由下列方程表示: 因此,得到的方程形成以下和配件是基于最小二乘算法使用LabVIEW 7.1环境,为每一个不同的内容类型和两个指标: 上面的模型提出了可接受的行为对于SSIM的情况以及1080年PSNR值情况下的我,但未能充分模型720 p的PSNR值情况下,这一事实是显而易见的从第二的平均误差和标准差 模型拟合在表6。每种内容类型的所有系数可以在表78


720便士 1080年,我

SSIM PSNR值 SSIM PSNR值

运动活动 平均误差 错误性病 平均误差 错误性病 平均误差 错误性病 平均误差 错误性病

1 9.12609 e-11 0.0541336 1.63586 e-9 5.32856 1.87671平台以及 0.068829 7.62564 e-9 2.8576
2 1.7857 e-11 0.0724123 3.20952 e-9 3.55376 1.0412平台以及 0.0862927 3.33925 e-9 3.08074
3 9.23496 e-11 0.113849 1.8 e-8 14.0633 3.42642 e-11 0.105127 3.10354 e-9 3.00685
4 3.83357 e-11 0.117794 1.57997 e-9 9.95972 6.21223 e-11 0.128392 2.04578 e-9 2.79959
5 2.00853 e-11 0.0963483 6.46447 e-11 9.18432 2.01423平台以及 0.115457 1.85578 e-9 3.13145

tabA3”src=
表7:第二个模型的系数
tabA4”src=
表8:第二个模型的系数

最后,端到端模型而言,一个函数结合的结果子系统a和B中定义(4)和(4 b)是必要的。从(2),它可以证明,SSIM的值的范围从(0 - 1)根据原文的相似和视频帧进行处理。此外,A和B子系统连接在级联导致添加剂恶化的图像质量相关的行为。基于上述言论,提出模型的端到端系统SSIM指标定义由以下功能: 另一方面,PSNR值度量是一个对数测量用分贝表示了(1)。因此,端到端指标的最终结果是事实上的叠加部分子系统指标,最小值的最小偏值的定义。这是类似于叠加应用到不相关的声音来源的计算等效声压级(54)如下: 在我们的例子中,基于计算公式(14)转换为以下: 函数(13)和(15)被应用于所有的人权观察表中定义1720 p, 1080年我和两者的结合和结果总结在表9


端到端质量指标

SSIM PSNR值

测试集 错误的意思 错误性病 错误的意思 错误性病

所有 0.02 0.03 0.45 0.73
720便士 0.02 0.02 0.37 0.62
1080年,我 0.03 0.04 0.59 0.87

4.2。定性评价

在检查整个系统的设置可能的参数可以定义其性能和考虑到所有的限制,一个核心系统配置选择受到微小的改动。这个配置在其他相关研究的结论为依据,以及经济实用的原因。的实现技术,已经被测试和评估分别单独或与其他在进行实际实验使用是决定性的。所以机会来评估系统的性能通过发射或接收真实事件。

已经声明,美国发生了三个传输和两个招待会。从第一个三个传输,进行了有益的结论,分别对系统的潜力。选择格式,记录技术和设备进行了测试,结果是有前途的可行性系统也有兴趣的潜在观众无论投影发生在大的礼堂(佩特雷大学)。观众接受事件的预测与热情和高清视频的感觉和环绕声被每个人都明显的和积极的评价。使用一个相机评估是积极的,在任何情况下不单调,尽管屏幕的大小是小于推荐。

两个传输的接收从全球的费城交响乐团音乐会系列给我们机会一次评估系统的性能和比较在一个完全不同的方法控制投影网站并进行了一项调查,在一个更大的一群人。虽然只有一个相机的使用并非如此在这些传输,传输系统的其余部分是我们使用几乎相同,所以调查结果可以为评估是有用的。

网络传输的发生提供了一个高100 Mbps的带宽和很高的QoS。因此,编码器的比特率是18 Mbps,传输格式1080 i25 MP@HL(4:2:0)剖面和UDP数据包形成协议。其他参数的原因已经被提到是恒定比特率(CBR),共和党IBBP格式,和相对较低的12帧的长度。使用的编码器与HD泰德E5280扩展模块,译码器是主要用来泰德T1228译码器和二级VLC软件安装在PC和DLP-technology使用投影仪。

这个配置在一个传输和接收的情况下,56人参加了调查,完成调查问卷。受试者没有专家,并随机选择。他们考虑到问卷在投影之前或在休息和补充。指示是提前阅读它,以确保最坏的情况。这是因为受试者在阅读的问题集中,注意即使对小质量退化。受试者要求等描述视频和音频的总质量分别使用5自由度规模和质量评估质量退化。规模是ITU提出的类似于一个用于单一刺激连续质量评价(SSCQE) [32- - - - - -34,55]。此外,他们被问及看事件的总经验通过这种方式和必须回答他们找到了多少现实的投影。另一个问题是,如果他们想看另一个事件,他们的动机是什么,他们看什么改进建议?从验证测试,三个受试者拒绝回答不一致或不完整的问题。

结果呈现在图5表明在这两种情况下,传输从塞萨洛尼基和费城,受试者评估视频质量的“很好”或“优秀”,超过80%,声音质量的70%以上。超过60%,大多数的受试者的退化和损伤评估的视频和音频“可察觉的,但不讨厌”或“听不清。“最后的总经验事件被评价为“非常现实”或“有趣”70%以上。

很明显,结果是“空洞效应的影响。“这可以用这一事实来解释观众第一次看这样的传播。然而,积极回答的比例非常高引起的效应。另一个有趣的发现是,比较被试回答的答案在第一调查(传输)的频率回答“现实主义”的评价总经验高于相对的第二次调查(接待)。小尺寸的样品在两项调查结果在一个大比例的置信区间的答案“现实的”所以我们可以假设有一种趋势的观众来评估一个相机的使用更为现实。这可以声称一旦所有其他参数都是相同的在这两种情况下和相对比例有很大差异的的第一个传输,因此一个摄像头使用。为了证明这个语句的有效性,更详细的调查是必要的。

6代表了受试者的答案的空间分布的第二次调查。不能评估各自的第一次调查的结果,因为样本的大小。A1位于左前投影屏幕面对观众的一部分。可能观察到对象的分布,分别和几个参数的评价。很明显从图6(c)受试者最低观看距离附近选址评估视频质量比的正前方或正后方。这图结合图6(e)证明,坐着比最小的观看距离近,观看体验降低和视频错误和障碍更明显。图6(d)显示,因为穷人的声学性能的远程礼堂,听体验更接近的喇叭除了屏幕和后面的墙壁。

4.3。结论和进一步的工作

当前工作的目的是实现和评估HDTV / IP技术在现实世界的多媒体广播应用程序中,通过宽带网络实时传输的文化活动(如Internet2和Geant骨干)。各种评价过程进行了结合网络模拟和不同的配置设置,最后选择的体系结构是决定和部署。当前工作的稳固性源于这一事实类似实验过程并没有被认为是对于特定的“增强现实”应用程序,如电子学习,电子办公,telecollaboration等等。该系统是由观众热情地接受了,证明是可行和可靠的。采用方法使用single-still相机结合大型投影屏幕和theater-adapted环绕声似乎提供了现实主义。鉴于上述场景结合优化我们进行测试,造成最小的规范要求(比特率,抖动)这样一个任务。具体来说,CBR编码18 Mbps UDP在抖动条件下0.10毫秒证实为高质量的传输是一个最小的选择,尽管进一步的实验可能会导致更多的网络资源的优化利用和增加宽容QoS变化。例如,使用额外的VBR业务组合,ProMPEG选举委员会对于今天的mpeg - 2,不同的压缩格式(mpeg - 4,对WMV等),各种类型和长度的共和党,低/高比特率正在考虑中。潜在的完整系统的交互是另一个问题。

此外,一个更复杂的传播建模的调查是基于模拟假设基准电路(hrc)。建立一个有条件的模型设置显示的端到端性能估算的可行性从两个子系统的不同属性对编码过程(对数曲线拟合)和传输过程(指数曲线拟合混合),分别。模型提出了可接受的性能的情况下除了网络子系统的PSNR造型720 p的情况下要求进一步调查。应用系统的同时,定性评价,证明假设了在设计过程中主要是关于物理方面的项目。演进的模型可能包括公司这样的主观测试和感知调整指标的性能定义QoS /体验质量系统,子系统的属性参数化的扩展以及音频性能估算。

在任何情况下,我们可能会得出这样的结论:在数字多媒体广播、宽带网络的影响的描述,将带来一个新时代文化和教育世界的前景。

确认

作者要感谢费城Orchestra-Global音乐会系列的有价值的合作项目团队的贡献以及音响工程师博士生k Kontos在项目的开发阶段。

引用

  1. o .弗里德里希·a·Al-Hezmi s Arbanowski, t . Magedanz”进化基于ims的下一代网络向一个集成平台IPTV服务”《Internalional研讨会上应用程序和网络研讨会(圣' 07)广岛,p。10日,日本,2007年1月。视图:出版商的网站|谷歌学术搜索
  2. o .弗里德里希·a·Al-Hezmi s Arbanowski, t . Magedanz“下一代IPTV服务延长IMS架构,”学报》第八届国际研讨会上自治分散系统(ISADS ' 07)塞多纳,页429 - 436年,亚利桑那州,美国,2007年3月。视图:出版商的网站|谷歌学术搜索
  3. a . Al-Hezmi o .弗里德里希·s . Arbanowski, t . Magdanz”要求一个基于ims四重奏”服务架构。”IEEE网络,21卷,不。2,只愿降价,2007页。视图:出版商的网站|谷歌学术搜索
  4. a . Al-Hezmi y Rebahi、t . Magedanz和s . Arbanowski“交互式IPTV,手机用户,”学报》国际会议上数字通信(ICDT 06年),45页,蔚蓝海岸,法国,August-September 2006。视图:出版商的网站|谷歌学术搜索
  5. h·j·康、黄懿慧宋和s . g . Choi”分支流的方法使用IP多播高清电视媒体网关,”第七届国际会议上先进通信技术学报》(ICACT ' 05),1卷,页393 - 396,凤凰公园,韩国,2005年2月。视图:谷歌学术搜索
  6. t . Kuge“如JPEG2000高清电视节目生产系统的发展,”《IEEE国际会议上图像处理,页505 - 508年,亚特兰大,乔治亚州,美国,2006年10月。视图:出版商的网站|谷歌学术搜索
  7. j·李和k分”,压缩高清晰度电视(HDTV)在IPv6,”《Internalional研讨会上应用程序和网络研讨会(圣06年)美国,页22日至25日,凤凰城,亚利桑那州,2006年1月。视图:出版商的网站|谷歌学术搜索
  8. k .杰克,视频揭秘:手册的电子工程师英国牛津,爱思唯尔,第四版,2005年版。
  9. g . Steinke“高清环绕声伴随高清图片,”学报》国际Tonmeister研讨会巴伐利亚,德国,2005年的10月。视图:谷歌学术搜索
  10. m . Sugawara Mitani k、m .金泽f·冈和y Nishida”HDTV-technical趋势对1080 p,未来前景”美国国际广播会议(IBC 05)2005年9月,法国贡比涅。视图:谷歌学术搜索
  11. j·c·惠特克:“搜索新的视觉体验”创建数字内容、j .大米和b .麦凯南Eds。,pp. 351–366, McGraw-Hill, New York, NY, USA, 2002.视图:谷歌学术搜索
  12. m . Emoto k . Masaoka m . Sugawara和f·冈”视角影响广角视频投影图像在人类的平衡,”显示,26卷,不。1,9-14,2005页。视图:出版商的网站|谷歌学术搜索
  13. h·金米欧,n . Toshiyuki h . Koichiro, o . Kazuho“先进的多通道音频系统和优越的印象和现实存在,”学报116 AES公约,柏林,德国,2004年5月,论文数量:6053。视图:谷歌学术搜索
  14. h·金米欧,h . Koichiro, n . Toshiyuki o .玲子,“繁殖存在高度信息的有效性和现实在多声道音频系统中,”学报120 AES公约,巴黎,法国,2006年5月,论文数量:6679。视图:谷歌学术搜索
  15. h·金米欧,h . Koichiro,欧玲子,“22.2多声道音响系统及其应用”学报118 AES公约巴塞罗那,西班牙,2005年5月,论文数量:6406。视图:谷歌学术搜索
  16. h·金米欧:Yasushige: Toshiyuki,欧玲子,“宽听地区特殊空间22.2多声道音响系统的音质,”学报122 AES公约,维也纳,奥地利,2007年5月,论文数量:7073。视图:谷歌学术搜索
  17. m . Emoto k . Masaoka m . Sugawara f·冈,“量化评价的感觉出现在观看“超高清“4000 -扫描行广角视频系统”程序的存在瓦伦西亚,页62 - 66年,西班牙,2004年10月。视图:谷歌学术搜索
  18. f·冈,m .金泽Mitani k . et al .,“Ultrahigh-definition电视系统4000扫描行,”NAB BEC学报》沈Guobin(杜松子酒)和j . Cai Eds。,pp. 437–440, Las Vegas, Nev, USA, April 2004.视图:谷歌学术搜索
  19. 沈(杜松子酒)和j . Cai Eds。多媒体网络,“多媒体的发展文章ID 97262卷,2007年,第1页,2007页。视图:出版商的网站|谷歌学术搜索
  20. 数字影院倡议有限责任公司,http://www.dcimovies.com/
  21. Internet2,http://www.internet2.org/
  22. GEANT,http://www.geant.net/
  23. 实验室电声学和电视系统”,高清电视通过IP:文化活动的直播,”项目报告,2007年,http://avlab.ee.auth.gr/hdtv/index_en.html视图:谷歌学术搜索
  24. 费城交响乐团,“全球音乐会系列:现场直播音乐会在Internet2和互动内容你的位置,”http://www.philorch.org/internet2_1.html视图:谷歌学术搜索
  25. b . Pesquet-Popescu a Dumitras, b . Macq Eds。,“Video analysis and coding for robust transmission,”EURASIP应用信号处理》杂志上文章ID 53981卷,2006年,3页,2006。视图:出版商的网站|谷歌学术搜索
  26. p .闭目和m . Reisslein”评估多媒体网络使用视频跟踪机制,“IEEE势,24卷,不。4,21 - 25日,2005页。视图:出版商的网站|谷歌学术搜索
  27. 即g·理查森,h和mpeg - 4视频压缩:视频编码下一代多媒体约翰•威利& Sons奇切斯特,英国,2003年。
  28. 肯尼迪。杨(凯文)小时。施泰因巴赫挂,大肠,和M.-T。太阳,Eds。,“Advanced video technologies and applications for H.264/AVC and beyond,”EURASIP应用信号处理》杂志上文章ID 27579卷,2006年,3页,2006。视图:出版商的网站|谷歌学术搜索
  29. s . Kanumuri p Cosman, A . r . Reibman“广义线性模型对mpeg - 2包丢失可见性,”学报》第十四届国际包视频研讨会(PV 04年)美国加州尔湾分校,2004年12月。视图:谷歌学术搜索
  30. o . A . Lotfallah m . Reisslein, s . Panchanathan“先进的视频跟踪的框架:评估视觉质量在有损网络视频传输,”EURASIP应用信号处理》杂志上ID 42083条,卷。2006年,21页,2006。视图:出版商的网站|谷歌学术搜索
  31. z, a·c·Bovik h·r·谢赫和e . p . Simoncelli“图像质量评估:从错误的可见性结构相似,“IEEE图像处理,13卷,不。4、600 - 612年,2004页。视图:出版商的网站|谷歌学术搜索
  32. 温克勒,数字视频质量:视觉模型和指标约翰•威利& Sons奇切斯特,英国,2005年。
  33. h·霍夫曼,t . Itagaki d木头,和一杯啤酒,”研究比特率与1920年高清格式的要求 × 1080像素的分辨率,在50 Hz逐行扫描帧速率针对大型平板显示器,”IEEE广播,52卷,不。4、420 - 434年,2006页。视图:出版商的网站|谷歌学术搜索
  34. h·霍夫曼,t . Itagaki d木、t·海因茨和t . Wiegand”小说的主观图像质量评估和进一步的研究方法高清电视格式,“IEEE广播,54卷,不。1,1-13,2008页。视图:出版商的网站|谷歌学术搜索
  35. ITU-T教程中,“客观感知的视频质量评估:全部参考电视,“国际电信联盟,2004年瑞士,日内瓦。视图:谷歌学术搜索
  36. 答:丰田,h·金米欧i Atsushi et al .,“生产和实时传输的22.2多通道声超高清晰度电视,”学报122 AES公约,维也纳,奥地利,2007年5月,论文数量:7137。视图:谷歌学术搜索
  37. c . a . Dimoulas k . a . Avdelidis g . m . Kalliris和g . v . Papanikolaou”联合小波视频去噪和运动活动在人类活动多通道检测分析:应用程序仍bioacoustic /心理生理监测,“EURASIP在信号处理的发展》杂志上文章ID 792028卷,2008年,19页,2008。视图:出版商的网站|谷歌学术搜索
  38. k . Hamasaki s Komiyama k . Hiyama和h大“5.1和22.2多声道声音作品使用一个集成的环绕声平移系统,”NAB BEC学报》,页382 - 387,拉斯维加斯,内华达州,美国,2005年4月。视图:谷歌学术搜索
  39. n . h .协会“环绕立体声广播戏剧,报告”阿布技术委员会年会2006年11月,北京,中国。视图:谷歌学术搜索
  40. m·a·Gerzon”Ambisonics多路广播和视频。”音频工程协会杂志》上,33卷,不。11日,第871 - 859页,1985年。视图:谷歌学术搜索
  41. SoundField“SoundField技术,”2008年,http://www.soundfield.com/视图:谷歌学术搜索
  42. k . Avdelidis c . Dimoulas g . Kalliris, g . Papanikolaou”声源定位和B-format增强使用声场麦克风集”学报122 AES公约,维也纳,奥地利,2007年5月,论文数量:7091。视图:谷歌学术搜索
  43. p . Salembier“MPEG-7标准的概述和对视觉信息的分析,未来的挑战”EURASIP应用信号处理》杂志上,卷2002,不。4、343 - 353年,2002页。视图:出版商的网站|谷歌学术搜索
  44. c . Vegiris k Avdelidis, g . Papanikolaou“环绕声系统实现观众感觉经验增强。应用研究”第四届全国会议的声学学报》上2008年,萨丁,希腊,。视图:谷歌学术搜索
  45. ETSI”,规范使用视频和音频编码在广播应用程序基于mpeg - 2传输流,“ETSITR 101 154,DVB文档A001牧师,2007年2月7日。视图:谷歌学术搜索
  46. ITU-T, IPTV焦点团体诉讼,2008年。
  47. m . Mbise j·伍兹,“多媒体交互和基于应用程序和网络质量的经验指标水平考虑,”13学报》国际包视频研讨会(PVW ' 03)2003年4月,页28 - 29日,法国南特,。视图:谷歌学术搜索
  48. m .银和j·伍兹,“提高质量体验多媒体服务的QoS仲裁体验质量框架,”13学报》国际包视频研讨会(PVW ' 03)2003年4月,法国南特。视图:谷歌学术搜索
  49. h . Koumaras a . Kourtis学术界。林,C.-K。Shieh”理论框架MPEG-based序列的端到端视频质量预测,”学报》第三届国际会议上网络和服务(icn ' 07)p。62年,雅典,希腊,2007年6月。视图:出版商的网站|谷歌学术搜索
  50. ITU-T推荐P.10. / G。100附录我。”的定义的质量体验)2007年1月,”。视图:谷歌学术搜索
  51. l . Haglund”SVT测试集高清影音格式。”瑞典斯德哥尔摩电视,2006,ftp://vqeg.its.bldrdoc.gov/视图:谷歌学术搜索
  52. Linux基金会“NETEmml:网络模拟器”,2008年,http://www.linux-foundation.org/en/Net:没视图:谷歌学术搜索
  53. Semaca有限公司http://www.semaca.co.uk/content.php?produs=2
  54. c . Dimoulas g . Kalliris g . Papanikolaou, a . Kalampakas”长期信号检测、分割和总结使用小波和分形维数:一个生物声学应用胃肠蠕动监视”计算机在生物学和医学,37卷,不。4、438 - 462年,2007页。视图:出版商的网站|谷歌学术搜索
  55. 建议ITU-R BT.500-11(提问ITU-R 211/11),“主观评价方法的电视画面的质量,”2006年6月。视图:谷歌学术搜索

版权©2008 c, e . Vegiris et al。这是一个开放的访问分布在条知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。


更多相关文章

PDF 下载引用 引用
下载其他格式更多的
订单打印副本订单
的观点1600年
下载868年
引用

相关文章

文章奖:2020年杰出的研究贡献,选择由我们的首席编辑。获奖的文章阅读