文摘gydF4y2Ba

提出了一种新的数字图像稳定技术。它是基于模糊卡尔曼的全球运动矢量补偿(GMV),据估计在log-polar平面。使用四个局部运动矢量提取GMV logpolar (LMVs)计算各自的子图象的飞机。模糊系统的模糊卡尔曼系统包括卡尔曼滤波器的离散定常的定义。由于这种继承的递归性,输出结果为平滑图像序列。提出了稳定系统旨在补偿任何振动框架的绝对位置,log-polar域运动估计的基础上,由模糊卡尔曼过滤系统,因此模糊卡尔曼滤波系统的优点和log-polar转换是剥削。描述技术产生最佳结果的输出质量和水平的补偿。gydF4y2Ba

1。介绍gydF4y2Ba

数字视频稳定过程,视频信号平和反对不必要的振动,同时保留故意相机运动。几乎所有获得的图像序列受噪声和干扰影响相机恐慌,造成不稳定的控股和崎岖的地形。这些多余的图像序列的位置振荡影响的视觉质量,除了审美也是至关重要的一部分在机器人视觉等许多应用程序或在视频压缩。高视觉质量使人类或机器容易观察和感知序列,从而提取有意义的结果。几种不同的图像稳定方法已经在文献中报道,他们可以区分为三大类;不必要的波动的技术大多是旋转的稳定是由伺服电机,实现补偿锅和倾斜相机运动,分别被称为积极的图像稳定(gydF4y2Ba1gydF4y2Ba]。由电子硬件的图像稳定称为电子图像稳定(gydF4y2Ba2gydF4y2Ba]。最后,当不必要的振动补偿通过纯粹的图像处理技术,过程称为数字图像稳定(DIS) [gydF4y2Ba3gydF4y2Ba]。DIS系统是由连续两个单位:运动估计和运动补偿。第一单元的目标是计算运动矢量,并最终GMV。补偿单元遵循运动估计和产生向量将当前帧的位置,这样的输出是免费的违规行为,维护所需的全球运动。影响性能的一个重要特性DIS系统的噪音水平。显然,降低噪音是顺畅的结果。GMV计算已经意识到通过各种技术,如相位相关匹配(gydF4y2Ba4gydF4y2Ba和归一化互相关gydF4y2Ba5gydF4y2Ba]。执行实时说实现图像匹配的两个连续的图像,通过Fourier-Mellin转变一直在报道(gydF4y2Ba6gydF4y2Ba]。在[gydF4y2Ba7gydF4y2Ba],GMV评估优化的模糊逻辑的开发。卡尔曼滤波是利用改进的补偿帧位置的gydF4y2Ba4gydF4y2Ba,gydF4y2Ba8gydF4y2Ba]。除了匹配技术,采取了光流的估计序列的运动。不受欢迎的运动效果计算(gydF4y2Ba9gydF4y2Ba)通过估计旋转中心和当地平移运动角频率定义fine-to-coarse多分辨率运动估计。在[gydF4y2Ba10gydF4y2Ba),稳定是通过关注中央图像区域,而光流估计优化这个近似。LMVs确定运动的粒子图像,导致一个更好的估计缩进相机运动的和不受欢迎的运动。一种广泛使用的技术是通过一系列LMVs计算GMV。帧搜索算法的计算成本隐含的计算子图象的全球运动。LMVs估计在这些区域有高度减少了处理时间。图像序列的转换少计算密集型拓扑重组进一步减少了处理和计算资源。gydF4y2Ba

在这篇文章中,我们改变了笛卡儿成log-polar的图像(gydF4y2Ba11gydF4y2Ba,gydF4y2Ba12gydF4y2Ba]和我们计算的GMV四LMVs各自的图像区域。由此产生的方法达到较低的处理时间,高效的实时实现。由于内在注意力log-polar性质转换,LMVs展品的运动估计空变分布。此外,模糊卡尔曼提出了DIS技术。卡尔曼滤波和模糊系统已经广泛被用于说应用程序。递归模糊系统提供最优的结果。之前进口的平和位移模糊系统,通过卡尔曼滤波或另一个过滤器,还提供了模糊系统的效率(gydF4y2Ba7gydF4y2Ba]。然而,在这项工作卡尔曼滤波器的递归性是直接引入模糊系统,而不是表达作为标准离散定常系统。提出的模糊输入系统表达estimation-correction卡尔曼滤波方程。因此,预期的相机运动是保存更有效,因为它主要是在前台发生。因此,GMV估计模糊卡尔曼滤波是利用。在每个时间步,估计运动矢量是先天的测量,而系统的输出是后验的。最后,校正是通过前面的测量,可用于估计的。模糊系统是测试了几种类型的隶属度函数(MFs)和不同的聚合和去模糊化方法。测量波动没有进行进一步的过滤。使用log-polar图像的运动领域提取快速发布和优化结果对每一帧的稳定和视频的视觉质量输出,在所有的情况下进行测试。 The whole operation exploits the advantages of the log-polar plane and the fuzzy Kalman system.

2。运动估计gydF4y2Ba

的运动估计单位提取GMV DIS系统。这个单位区分所需的和不必要的运动效果。的关键特性是预期的摄像机运动估计的准确性。提出了几种运动估计方法。他们的主要类别是块匹配(gydF4y2Ba13gydF4y2Ba),相关联(gydF4y2Ba14gydF4y2Ba),和光学流的gydF4y2Ba15gydF4y2Ba]。gydF4y2Ba

2.1。Log-Polar转换gydF4y2Ba

运动估计是极其苛刻的com-putation和资源。二次抽样的图像往往是为了克服这个计算负载使用。因此,拓扑的安排,特别是空变,如log-polar,提供较小的图像数据量没有限制的视野或注视点的图像分辨率。log-polar转换是基于人类的眼睛视网膜投影平面视觉皮层。在视觉上它找到它的起源研究机制的哺乳动物。采用这种拓扑人工视觉系统ex-hibits几个优势在视觉注意力,吞吐率和实时处理。log-polar转换已报告的许多应用,如time-to-impact估计(gydF4y2Ba11gydF4y2Ba),小波提取基于log-polar映射(gydF4y2Ba16gydF4y2Ba],跟踪[gydF4y2Ba17gydF4y2Ba),和差距评估和聚散度控制(gydF4y2Ba18gydF4y2Ba]。gydF4y2Ba

log-polar映射的数学模型可以表示为一个极之间的转换(gydF4y2Ba gydF4y2Ba ,gydF4y2Ba gydF4y2Ba )(视网膜)log-polar (gydF4y2Ba gydF4y2Ba ,gydF4y2Ba gydF4y2Ba )(皮质平面)和笛卡尔平面gydF4y2Ba (gydF4y2Ba gydF4y2Ba ,gydF4y2Ba gydF4y2Ba )gydF4y2Ba (屏),如图gydF4y2Ba1gydF4y2Ba。As-suming Nr细胞的数量在径向方向和Na细胞的数量在角方向,从极坐标映射(gydF4y2Ba gydF4y2Ba ,gydF4y2Ba gydF4y2Ba 对数极坐标()gydF4y2Ba gydF4y2Ba ,gydF4y2Ba gydF4y2Ba );log-polar变量gydF4y2Ba gydF4y2Ba 和gydF4y2Ba gydF4y2Ba 被定义为gydF4y2Ba gydF4y2Ba =gydF4y2Ba lgydF4y2Ba ogydF4y2Ba ggydF4y2Ba gydF4y2Ba gydF4y2Ba gydF4y2Ba gydF4y2Ba 0gydF4y2Ba gydF4y2Ba ,gydF4y2Ba gydF4y2Ba gydF4y2Ba =gydF4y2Ba gydF4y2Ba gydF4y2Ba ,gydF4y2Ba 2gydF4y2Ba gydF4y2Ba (gydF4y2Ba 1gydF4y2Ba )gydF4y2Ba 在哪里gydF4y2Ba gydF4y2Ba 每一行的像素,gydF4y2Ba gydF4y2Ba 每一列像素,gydF4y2Ba gydF4y2Ba 0gydF4y2Ba 是中央的半径。对数基础gydF4y2Ba gydF4y2Ba 从视网膜中央凹半径,获得图像半径gydF4y2Ba gydF4y2Ba 米gydF4y2Ba 一个gydF4y2Ba xgydF4y2Ba 和径向分辨率gydF4y2Ba gydF4y2Ba gydF4y2Ba :gydF4y2Ba gydF4y2Ba gydF4y2Ba gydF4y2Ba =gydF4y2Ba gydF4y2Ba 米gydF4y2Ba 一个gydF4y2Ba xgydF4y2Ba gydF4y2Ba 0gydF4y2Ba ogydF4y2Ba rgydF4y2Ba gydF4y2Ba =gydF4y2Ba gydF4y2Ba (gydF4y2Ba 1gydF4y2Ba /gydF4y2Ba gydF4y2Ba gydF4y2Ba )gydF4y2Ba lgydF4y2Ba ngydF4y2Ba gydF4y2Ba gydF4y2Ba 米gydF4y2Ba 一个gydF4y2Ba xgydF4y2Ba /gydF4y2Ba gydF4y2Ba 0gydF4y2Ba gydF4y2Ba 。gydF4y2Ba (gydF4y2Ba 2gydF4y2Ba )gydF4y2Ba

前面提到的数学公式应用于图像如图gydF4y2Ba2(一个)gydF4y2Ba结果log-polar形象图gydF4y2Ba2 (b)gydF4y2Ba。在图gydF4y2Ba2 (c)gydF4y2Ba,重建的笛卡尔表示log-polar图像显示。gydF4y2Ba

2.2。运动领域提取gydF4y2Ba

图像运动是现实世界三维运动的投影到二维图像平面。这是表达图像速度或位移的形象gydF4y2BaxgydF4y2Ba和gydF4y2BaygydF4y2Ba光流场的轴。光流技术分为三大类:微分技术,frequency-based的和匹配的方法(gydF4y2Ba15gydF4y2Ba]。选择是一个微分计算方法,即古典角和Schunk光流模型的修改(gydF4y2Ba19gydF4y2Ba]。gydF4y2Ba

为了减少运动估计的计算负载,水平和垂直轴位移计算选择图像区域位于图像的边缘。笛卡尔平面上,这些有一个矩形的440gydF4y2Ba ×gydF4y2Ba 100像素和100gydF4y2Ba ×gydF4y2Ba 280像素,分别如图gydF4y2Ba3(一个)gydF4y2Ba。尽管如此,计算的执行LMVs log-polar平面。相应的补丁有拱的形状尺寸7353像素和1893像素,分别如图gydF4y2Ba3 (b)gydF4y2Ba。gydF4y2Ba

log-polar平面上的运动估计,有一些特殊的功能,应该考虑,也就是说,运动矢量不转移直接从笛卡尔到log-polar飞机由于引入了虚构的极地图像灰度值曲率(gydF4y2Ba12gydF4y2Ba]。估计LMVs后,GMV四LMVs的平均价值,因为它为测试图像序列提供了更好的结果。然后位移被导入到模糊卡尔曼滤波系统,没有进一步的处理。gydF4y2Ba

3所示。模糊卡尔曼滤波系统gydF4y2Ba

卡尔曼滤波的递归方程预示校正为模糊输入的定义了。地面真值的模糊卡尔曼滤波系统中获得的位移光流技术,在运动估计阶段。使用模糊卡尔曼系统方程是描述成图gydF4y2Ba4gydF4y2Ba和定义如下。gydF4y2Ba

预测:gydF4y2Ba
gydF4y2Ba −gydF4y2Ba gydF4y2Ba =gydF4y2Ba gydF4y2Ba gydF4y2Ba gydF4y2Ba −gydF4y2Ba 1gydF4y2Ba gydF4y2Ba gydF4y2Ba +gydF4y2Ba gydF4y2Ba ,gydF4y2Ba ̂gydF4y2Ba gydF4y2Ba −gydF4y2Ba gydF4y2Ba =gydF4y2Ba gydF4y2Ba ̂gydF4y2Ba gydF4y2Ba −gydF4y2Ba gydF4y2Ba −gydF4y2Ba 1gydF4y2Ba +gydF4y2Ba gydF4y2Ba gydF4y2Ba gydF4y2Ba 。gydF4y2Ba (gydF4y2Ba 3gydF4y2Ba )gydF4y2Ba

更正:gydF4y2Ba
我gydF4y2Ba ngydF4y2Ba pgydF4y2Ba ugydF4y2Ba tgydF4y2Ba 1gydF4y2Ba gydF4y2Ba =gydF4y2Ba gydF4y2Ba gydF4y2Ba −gydF4y2Ba 1gydF4y2Ba −gydF4y2Ba ̂gydF4y2Ba gydF4y2Ba −gydF4y2Ba gydF4y2Ba ,gydF4y2Ba (gydF4y2Ba 4gydF4y2Ba )gydF4y2Ba 我gydF4y2Ba ngydF4y2Ba pgydF4y2Ba ugydF4y2Ba tgydF4y2Ba 2gydF4y2Ba gydF4y2Ba =gydF4y2Ba 我gydF4y2Ba ngydF4y2Ba pgydF4y2Ba ugydF4y2Ba tgydF4y2Ba 1gydF4y2Ba gydF4y2Ba −gydF4y2Ba 我gydF4y2Ba ngydF4y2Ba pgydF4y2Ba ugydF4y2Ba tgydF4y2Ba 1gydF4y2Ba gydF4y2Ba −gydF4y2Ba 1gydF4y2Ba gydF4y2Ba ,gydF4y2Ba (gydF4y2Ba 5gydF4y2Ba )gydF4y2Ba gydF4y2Ba =gydF4y2Ba gydF4y2Ba −gydF4y2Ba gydF4y2Ba gydF4y2Ba gydF4y2Ba gydF4y2Ba gydF4y2Ba gydF4y2Ba −gydF4y2Ba gydF4y2Ba gydF4y2Ba gydF4y2Ba gydF4y2Ba +gydF4y2Ba gydF4y2Ba −gydF4y2Ba 1gydF4y2Ba gydF4y2Ba ,gydF4y2Ba (gydF4y2Ba 6gydF4y2Ba )gydF4y2Ba gydF4y2Ba =gydF4y2Ba gydF4y2Ba gydF4y2Ba −gydF4y2Ba gydF4y2Ba gydF4y2Ba gydF4y2Ba gydF4y2Ba gydF4y2Ba −gydF4y2Ba gydF4y2Ba ,gydF4y2Ba (gydF4y2Ba 7gydF4y2Ba )gydF4y2Ba ̂gydF4y2Ba gydF4y2Ba gydF4y2Ba =gydF4y2Ba ̂gydF4y2Ba gydF4y2Ba −gydF4y2Ba gydF4y2Ba +gydF4y2Ba gydF4y2Ba gydF4y2Ba gydF4y2Ba gydF4y2Ba gydF4y2Ba −gydF4y2Ba gydF4y2Ba ̂gydF4y2Ba gydF4y2Ba −gydF4y2Ba gydF4y2Ba gydF4y2Ba ,gydF4y2Ba (gydF4y2Ba 8gydF4y2Ba )gydF4y2Ba gydF4y2Ba gydF4y2Ba ̂gydF4y2Ba gydF4y2Ba −gydF4y2Ba gydF4y2Ba ̂gydF4y2Ba gydF4y2Ba gydF4y2Ba gydF4y2Ba −gydF4y2Ba gydF4y2Ba 在哪里gydF4y2BakgydF4y2Ba是时候指数,gydF4y2Ba gydF4y2Ba gydF4y2Ba 测量值在当前时间步,然后呢gydF4y2Ba ×gydF4y2Ba 的先验估计帧的位置。gydF4y2Ba 1gydF4y2Ba 米gydF4y2Ba 年代gydF4y2Ba EgydF4y2Ba =gydF4y2Ba gydF4y2Ba gydF4y2Ba gydF4y2Ba gydF4y2Ba =gydF4y2Ba 1gydF4y2Ba gydF4y2Ba gydF4y2Ba gydF4y2Ba −gydF4y2Ba gydF4y2Ba gydF4y2Ba gydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba gydF4y2Ba gydF4y2Ba lgydF4y2Ba 年代gydF4y2Ba EgydF4y2Ba =gydF4y2Ba gydF4y2Ba −gydF4y2Ba gydF4y2Ba gydF4y2Ba gydF4y2Ba 2gydF4y2Ba 1gydF4y2Ba =gydF4y2Ba 米gydF4y2Ba 我gydF4y2Ba ngydF4y2Ba ,gydF4y2Ba lgydF4y2Ba 米gydF4y2Ba 年代gydF4y2Ba EgydF4y2Ba =gydF4y2Ba ,gydF4y2Ba gydF4y2Ba gydF4y2Ba gydF4y2Ba gydF4y2Ba =gydF4y2Ba 1gydF4y2Ba gydF4y2Ba gydF4y2Ba gydF4y2Ba −gydF4y2Ba gydF4y2Ba gydF4y2Ba gydF4y2Ba 2gydF4y2Ba =gydF4y2Ba 米gydF4y2Ba 我gydF4y2Ba ngydF4y2Ba ,gydF4y2Ba (gydF4y2Ba 9gydF4y2Ba )gydF4y2Ba 是后验估计帧的位置。gydF4y2Ba gydF4y2Ba gydF4y2Ba 和gydF4y2Ba gydF4y2Ba gydF4y2Ba 分别定义先验和后验误差协方差矩阵。第一个输入(gydF4y2Ba4gydF4y2Ba)被定义为绝对坐标系之间的区别翻译和稳定帧位置的先验估计。第二个输入(gydF4y2Ba5gydF4y2Ba)表示的变化率输入在当前时间的第一步。在每次测量值指数代表帧的翻译。调优变量gydF4y2Ba问gydF4y2Ba和gydF4y2BaRgydF4y2Ba过程和测量噪声,分别设置为10的比例(gydF4y2BaRgydF4y2Ba/gydF4y2Ba问gydF4y2Ba= 10)。收益率更快响应比例较高,但最终的输出不够平滑,最后一帧的位置接近测量的。高gydF4y2BaRgydF4y2Ba值导致低反应,尽管高频率切断,提供平稳输出。为了提供一个快速响应率设为10,虽然和更高的比率100年推出了最终的输出的误差较小。gydF4y2Ba

模糊系统的设计的关键特性是MFs和决策规则的形状。在拟议的系统中,五个MFs用于每个输入和输出,因为它们是有效的完成所需的任务。模糊规则的建设依赖于设计者的经验和所使用的应用程序。在我们的任务,是一个需要覆盖的范围为了最终的输出不够光滑。因此,通常选择分发范围或进口更多MFs MFs。MFs导致更多模糊规则,因此更高的复杂性。MFs的类型的选择也是至关重要的一个模糊系统的建设。的测试类型MFs是高斯,梯形和三角形的。在所有的实验中,所有的变量(输入和输出)MFs的类型相同。两个输入和输出通常是分配给他们的范围来获得,提到,平稳输出。 All the variables define the frame translations and are set to [−8   8] pixels, as 8 pixels were the maximum absolute translation both on the horizontal and the vertical axis. The sign indicates the direction of the movement, that is, left or right and up or down. The rules interaction set is depicted in Table1gydF4y2Ba和图gydF4y2Ba5gydF4y2Ba说明了高斯MFs的模糊系统。模糊系统扮演重要角色的调整方法,如暗示,去模糊化,聚合的。在拟议的系统中,这意味着将产品和聚合方法,因为它提供了一个平滑的输出值。去模糊化方法设置为重心,因为它涵盖了更有效地输出范围。gydF4y2Ba

4所示。实验结果gydF4y2Ba

为了评估该系统的性能我们进行一些测试。这些包括不同稳定实验被主动立体视觉的头。获得序列的大小是640gydF4y2Ba480像素。一些测试输入的视频被收购,而积极的图像稳定日常运行。所有这些序列受到高频图像紧张,产生用户故意用于测试目的。他们还遭受高——光照变化以及波动造成的伺服电机。进一步的实验,获取视频免费课程。这些序列遭受运动模糊的框架。补救这样的序列是一个更高的帧速率。获得视频调到25 fps,快速振荡运动期间引发了高度信息丢失。捕捉这样的嘈杂和摇摇欲坠的序列的目的是评估提出了模糊卡尔曼系统对复杂和富有挑战性的环境。gydF4y2Ba

为了比较系统的效率稳定在四种不同的组合评估图像拓扑如下:gydF4y2Ba

(我)gydF4y2Ba笛卡儿的形象,全帧;gydF4y2Ba(2)gydF4y2BaLog-polar形象,全帧;gydF4y2Ba(3)gydF4y2Ba笛卡儿的形象,子图象;gydF4y2Ba(iv)gydF4y2Ba对数极坐标图像,子图象。gydF4y2Ba

使用LMVs笛卡尔比帧的图像提供了更好的结果。表gydF4y2Ba2gydF4y2Ba总结了比较的结果。为了测量的性能提出了稳定的均方误差(MSE),最小平方误差(LSE)和最小均方误差(LSME)计算。这些错误的方程,因为所有值是已知的,被定义为gydF4y2Ba在哪里gydF4y2Ba是最后的稳定和帧位置gydF4y2Ba是测量的运动估计阶段的每一次指数吗gydF4y2Ba我gydF4y2Ba。很明显,GMV提取通过LMVs log-polar飞机提供平滑的输出。模糊卡尔曼系统通过使用三角MFs更好的回应。视觉模糊卡尔曼滤波系统的结果显示在图gydF4y2Ba6gydF4y2Ba,而在图gydF4y2Ba7gydF4y2Ba最初和最后一帧的翻译显示所有测试场合。很明显,估计GMV进入log-polar飞机提供了更好的性能。gydF4y2Ba

此外,这些错误也计算出不同类型的MFs的效率。在表gydF4y2Ba3gydF4y2Ba,所有的测试演示了MFs的比较结果。从图gydF4y2Ba8gydF4y2Ba和表gydF4y2Ba3gydF4y2Ba,很明显,三角形MFs提供一个平滑输出时表现出较低的错误成本的定性检测。gydF4y2Ba

5。结论gydF4y2Ba

一种图像稳定技术,提出了一种模糊卡尔曼滤波系统的手段。模糊卡尔曼滤波计算的系统处理GMV log-polar平面。系统提供了一个平稳补偿输出所有的测试图像序列。提出了模糊系统,三角MFs证明产生较小的错误。log-polar图像的使用,以及卡尔曼滤波的递归性,导致了一个最佳的系统,它不仅稳定任何波动,而且过滤过程中噪音。最后,log-polar图像适合图像稳定,错误是短。提出了模糊卡尔曼系统是一个有价值的图像稳定和有效的工具。gydF4y2Ba

承认gydF4y2Ba

这部分工作是支持的电子商务研究项目“ACROBOTER”fp6 -是- 2006 - 045530。gydF4y2Ba