gydF4y2Ba我们研究的问题检测和定位对象,利用灰度图像提供的部分原因表示非负矩阵分解。非负矩阵分解是一个新兴的子空间方法的例子,就是能从一组模板映像对象中提取可说明的部分,然后分析使用它们来描述单个对象。在本文中,我们提出一个基于一些非负分解算法的原型系统,不同的附加属性添加到数据的非负表示,为了调查如果任何额外的约束产生更好的结果一般通过非负矩阵分解目标检测。
<年代p一个ncl作为年代=”end-abs">
1。介绍
gydF4y2Ba低维近似的概念起着重要的作用在有效且高效地处理和概念化大量的数据存储在大型稀疏矩阵。特别是,子空间技术,如奇异值分解(<一个href=”#B16">1一个>),主成分分析(PCA) (<一个href=”#B21">2一个>,独立分量分析(<一个href=”#B20">3一个>),代表了一类线性代数方法主要采用分析高维数据集,以发现潜在的结构通过投影到低维空间。一般来说,子空间方法的特点是通过学习一组基向量从一组合适的数据模板。这个向量张成的子空间能够捕获的基本结构的输入数据。一旦发现了子空间(在离线学习阶段),新样品的检测可以实现(所谓的在线检测阶段)时,将它的子空间,找到最近邻模板投射到这个子空间。这些方法已经找到有效的信息检索应用在多个领域,计算机视觉,模式识别,尤其是在人脸识别领域的(<一个href=”#B18">4一个>,5一个>),数字和字符的识别<一个href=”#B17">6一个>,7一个>),和分子模式发现(<一个href=”#B22">8一个>,9一个>]。
gydF4y2Ba然而,相关信息存储在许多数据矩阵往往是负的(例子是像素图像,一个特定的主题的概率出现在一个语言文件,工厂排放的污染物数量,等等(<一个href=”#B33">10一个>- - - - - -<一个href=”#B6">15一个>])。在分析过程中,考虑到这个nonnegativity约束可以带来一些好处的可解释性和大规模数据的可视化,同时保持更密切的物理可行性。然而,经典的子空间方法描述数据的结合涉及加法和减法组件的基本特性;因此,他们不能保证nonnegativity守恒。
gydF4y2Ba最近的低秩的方法非负矩阵分解(NMF)变得特别有吸引力来获取数据通过使用添加剂的减少表示组件。这个想法一直在激励的方式。首先在许多应用程序中(例如,通过物理规则的)一个知道所涉及的数量不能是负数。其次,nonnegativity一直主张基于直觉的部分通常是加法(而不是减去)相结合,形成一个整体;此外,心理和生理原则假定人类学习对象部分原因。因此,nonnegativity约束可能有用的学习(部分原因表示<一个href=”#B24">16一个>]。
gydF4y2Ba在本文中,我们调查的问题进行“通用的”对象检测在图像使用NMF的框架。通过执行“通用的”检测,我们检测,在一个给定的图像,类的对象,如任何车,任何的脸,而不是找到一个特定的对象(类实例),这样一个特定的车,或一个特定的脸。
gydF4y2Ba一般来说,目标检测的任务是通过比较对象相似之处少量的引用特性可以用整体(全球)或稀疏表示(本地)计算,然后采用一种学习机制来确定特征空间中的区域对应于感兴趣的对象类。在子空间技术,PCA构成方法的一个例子采用全局描述符相关的方差图像空间(所谓的eigenfaces)指定牌面图像视觉代表一组(<一个href=”#B40">17一个>]。其他整体的方法是基于全球描述符表示颜色、纹理直方图,和全球形象转换(<一个href=”#B35">18一个>]。另一方面,地方特色对于噪声已被证明是不变的,闭塞或构成视图和他们也支持的理论中引入“recognition-by-components”(<一个href=”#B3">19一个>]。最采用当地的特性类型伽柏特性(<一个href=”#B26">20.一个>),小波的特性<一个href=”#B38">21一个>),和矩形特征(<一个href=”#B42">22一个>]。提出了一些方法使用部分原因表现在<一个href=”#B30">23一个>,24一个>),但他们现在需要手动定义对象的缺点部分和词汇部分代表对象在目标类。最近,自动提取部分拥有高信息内容的本地信号变化说明(<一个href=”#B2">25一个>连同一个分类器基于稀疏表示的补丁中提取有趣的点在图像。
nonneg一个t我vity约束NMF让这个子空间方法的一种很有前途的技术,自动抽取部分描述对象类的结构。事实上,这些局部地区可以添加在一个纯粹添加剂的方法(不同组合系数)来描述单个对象,可以作为学习的机制从一组模板图像中提取可说明的部分。此外,利用距离的概念所张成的子空间提取部分,NMF,也可以采用学习方法来检测当一个对象是否存在在一个给定的图像。
gydF4y2Ba的一个有趣的例子,部分原因表示原始数据的上下文中可以找到图像清晰度库。这里,NMFs能够提取(四肢)从图像描绘现实的部分简笔画与四肢不同的发音。然而,应该指出,这样的存在严重依赖于对象本身(部分原因表示<一个href=”#B15">26一个>]。
gydF4y2Ba首先提出了NMF算法(的乘法和加法更新规则<一个href=”#B25">11一个>])在人脸识别领域的应用将脸图像分解成零件的特性,比如嘴唇,眼睛,鼻子。最近,对比其他非负部分原因算法(如非负稀疏编码和本地NMF)已经在面部特征的背景下,提出了学习,展示良好的性能在任期的检出率仅使用少量的基础组件(<一个href=”#B36">27一个>]。初步比较三NMF算法(经典乘法NMF [<一个href=”#B25">11一个>],当地NMF [<一个href=”#B27">28一个>],判别NMF [<一个href=”#B5">29日一个>])所示(<一个href=”#B4">30.一个>在彩色图像的识别不同的对象。此外,结果对NMF附加约束的影响,如稀疏提出(<一个href=”#B19">31日一个>],在[<一个href=”#B37">32一个>]因为各种维度的子空间生成的对象识别任务(特别是面部识别和手写数字识别)。
gydF4y2Ba在这里,我们调查的问题执行单一对象的检测在图像使用不同的NMF算法,为了查询如果表示NMF框架提供的能有效地产生附加值在检测和定位对象内部的图像。这里要探讨的问题可以形式化如下。给定一组模板图像代表同一个类的对象是一组对象的视觉从对方可能会略有不同但对应相同的语义概念,例如,汽车,数字,和脸,我们想了解如果NMF能提供一些当地特性表征,可以用于个别化对象在测试图像。
gydF4y2Ba剩下的纸是组织如下。在下一节中描述的数学计算非负矩阵因子分解问题和评论的一些文献中提出的算法,采用学习这样一个矩阵分解模型。这些算法将构成一个对象的核心检测原型系统的基础上,通过NMF学习,提出了部分<一个href=”#sec3">3一个>简要描述的离线和在线学习阶段。部分<一个href=”#sec4">4一个>介绍实验结果说明采用的属性NMF学习算法及其性能检测对象的图像。最后,部分<一个href=”#sec5">5一个>结尾总结和未来工作可能的方向。
2。数学背景和算法gydF4y2Ba的问题找到一个负的低维近似的一组数据模板存储在一个大维度数据矩阵<年代vghe我ght=”16。75” id="M1" style="vertical-align:-3.67531pt;width:61px;" version="1.1" viewbox="0 0 61 16.75" width="61" xmlns="http://www.w3.org/2000/svg">
∈
ℝ
+
×
可以表示如下。
gydF4y2Ba给定一个初始数据集表示的<年代vghe我ght=”8。7875004" id="M2" style="vertical-align:-0.3135pt;width:35.9375px;" version="1.1" viewbox="0 0 35.9375 8.7875004" width="35.9375" xmlns="http://www.w3.org/2000/svg">
×
矩阵<年代vghe我ght=”10。575" id="M3" style="vertical-align:-0.20064pt;width:12.625px;" version="1.1" viewbox="0 0 12.625 10.575" width="12.625" xmlns="http://www.w3.org/2000/svg">
,每一列是一个<年代vghe我ght=”7。1374998" id="M4" style="vertical-align:-0.10033pt;width:7.8874998px;" version="1.1" viewbox="0 0 7.8874998 7.1374998" width="7.8874998" xmlns="http://www.w3.org/2000/svg">
维原始数据库的非负向量(<年代vghe我ght=”7。1374998" id="M5" style="vertical-align:-0.10033pt;width:11.225px;" version="1.1" viewbox="0 0 11.225 7.1374998" width="11.225" xmlns="http://www.w3.org/2000/svg">
向量),找到一个近似分解的数据矩阵为基础矩阵<年代vghe我ght=”16。75” id="M6" style="vertical-align:-3.67531pt;width:63.025002px;" version="1.1" viewbox="0 0 63.025002 16.75" width="63.025002" xmlns="http://www.w3.org/2000/svg">
∈
ℝ
+
×
和一个编码变量矩阵<年代vghe我ght=”16。75” id="M7" style="vertical-align:-3.67531pt;width:64.6875px;" version="1.1" viewbox="0 0 64.6875 16.75" width="64.6875" xmlns="http://www.w3.org/2000/svg">
∈
ℝ
+
×
,都有负的元素,这样<年代vghe我ght=”10。575" id="M8" style="vertical-align:-0.20064pt;width:57.862499px;" version="1.1" viewbox="0 0 57.862499 10.575" width="57.862499" xmlns="http://www.w3.org/2000/svg">
≈
。
gydF4y2Ba一般来说,排名<年代vghe我ght=”7。0124998" id="M9" style="vertical-align:-0.0pt;width:6.5px;" version="1.1" viewbox="0 0 6.5 7.0124998" width="6.5" xmlns="http://www.w3.org/2000/svg">
的矩阵<年代vghe我ght=”10。575" id="M10" style="vertical-align:-0.20064pt;width:17.9625px;" version="1.1" viewbox="0 0 17.9625 10.575" width="17.9625" xmlns="http://www.w3.org/2000/svg">
和<年代vghe我ght=”10。325” id="M11" style="vertical-align:-0.0pt;width:15.175px;" version="1.1" viewbox="0 0 15.175 10.325" width="15.175" xmlns="http://www.w3.org/2000/svg">
远低于的排名<年代vghe我ght=”10。575" id="M12" style="vertical-align:-0.20064pt;width:12.625px;" version="1.1" viewbox="0 0 12.625 10.575" width="12.625" xmlns="http://www.w3.org/2000/svg">
(通常是选择这样<年代vghe我ght=”13。45”我d="M13" style="vertical-align:-2.21957pt;width:91.675003px;" version="1.1" viewbox="0 0 91.675003 13.45" width="91.675003" xmlns="http://www.w3.org/2000/svg">
(
+
)
<
)。矩阵的每一列<年代vghe我ght=”10。575" id="M14" style="vertical-align:-0.20064pt;width:17.9625px;" version="1.1" viewbox="0 0 17.9625 10.575" width="17.9625" xmlns="http://www.w3.org/2000/svg">
包含一个(NMF)张成的子空间的基向量,而每一列的<年代vghe我ght=”10。325” id="M15" style="vertical-align:-0.0pt;width:15.175px;" version="1.1" viewbox="0 0 15.175 10.325" width="15.175" xmlns="http://www.w3.org/2000/svg">
代表权重需要近似中相应的列<年代vghe我ght=”10。575" id="M16" style="vertical-align:-0.20064pt;width:12.625px;" version="1.1" viewbox="0 0 12.625 10.575" width="12.625" xmlns="http://www.w3.org/2000/svg">
通过向量<年代vghe我ght=”10。575" id="M17" style="vertical-align:-0.20064pt;width:17.9625px;" version="1.1" viewbox="0 0 17.9625 10.575" width="17.9625" xmlns="http://www.w3.org/2000/svg">
。
N米F实际上是一个锥形坐标变换:人物<一个href=”http年代://www.newsama.com/journals/acisc/2012/781987/fig1/" target="_blank">1一个>在二维空间提供了一个图形解释。这两个基向量<年代vghe我ght=”11。225” id="M18" style="vertical-align:-3.13504pt;width:18.325001px;" version="1.1" viewbox="0 0 18.325001 11.225" width="18.325001" xmlns="http://www.w3.org/2000/svg">
1
和<年代vghe我ght=”11。225” id="M19" style="vertical-align:-3.13504pt;width:18.325001px;" version="1.1" viewbox="0 0 18.325001 11.225" width="18.325001" xmlns="http://www.w3.org/2000/svg">
2
描述一个圆锥形的覆盖数据集<年代vghe我ght=”10。575" id="M20" style="vertical-align:-0.20064pt;width:12.625px;" version="1.1" viewbox="0 0 12.625 10.575" width="12.625" xmlns="http://www.w3.org/2000/svg">
。由于非负约束,只能重建点在这个锥通过这些基向量的线性组合:<年代p一个ncl作为年代=”equation" id="EEq1">
的分解<年代vghe我ght=”10。575" id="M22" style="vertical-align:-0.20064pt;width:57.862499px;" version="1.1" viewbox="0 0 57.862499 10.575" width="57.862499" xmlns="http://www.w3.org/2000/svg">
≈
礼物的缺点有关缺乏独特性因素。例如,如果一个任意可逆矩阵<年代vghe我ght=”12。5875" id="M23" style="vertical-align:-0.33858pt;width:58.950001px;" version="1.1" viewbox="0 0 58.950001 12.5875" width="58.950001" xmlns="http://www.w3.org/2000/svg">
∈
ℝ
×
这样两个矩阵<年代vghe我ght=”12。8125” id="M24" style="vertical-align:-0.20064pt;width:67.212502px;" version="1.1" viewbox="0 0 67.212502 12.8125" width="67.212502" xmlns="http://www.w3.org/2000/svg">
=
和<年代vghe我ght=”13。8375” id="M25" style="vertical-align:-0.0pt;width:78.75px;" version="1.1" viewbox="0 0 78.75 13.8375" width="78.75" xmlns="http://www.w3.org/2000/svg">
=
−
1
可以找到半正定,那么另一个分解<年代vghe我ght=”12。8125” id="M26" style="vertical-align:-0.20064pt;width:70.0625px;" version="1.1" viewbox="0 0 70.0625 12.8125" width="70.0625" xmlns="http://www.w3.org/2000/svg">
≈
的存在。这种转换是总是可能的<年代vghe我ght=”10。55" id="M27" style="vertical-align:-0.0pt;width:11.325px;" version="1.1" viewbox="0 0 11.325 10.55" width="11.325" xmlns="http://www.w3.org/2000/svg">
是一个可逆的非负单项矩阵(矩阵叫做单项式如果有一个在每一行和列元素不同于零)。然而,如果<年代vghe我ght=”10。55" id="M28" style="vertical-align:-0.0pt;width:11.325px;" version="1.1" viewbox="0 0 11.325 10.55" width="11.325" xmlns="http://www.w3.org/2000/svg">
是一个非负单项矩阵,在这种情况下,转换的结果是一个简单的缩放和排列的原始矩阵(<一个href=”#B1">33一个>]。
gydF4y2Ba一个NMF的给定数据矩阵<年代vghe我ght=”10。575" id="M29" style="vertical-align:-0.20064pt;width:12.625px;" version="1.1" viewbox="0 0 12.625 10.575" width="12.625" xmlns="http://www.w3.org/2000/svg">
可以通过非线性优化问题的解决方案在一个指定的误差函数。两个简单的误差函数通常用来测量原始数据之间的距离<年代vghe我ght=”10。575" id="M30" style="vertical-align:-0.20064pt;width:12.625px;" version="1.1" viewbox="0 0 12.625 10.575" width="12.625" xmlns="http://www.w3.org/2000/svg">
和它的低维近似<年代vghe我ght=”10。575" id="M31" style="vertical-align:-0.20064pt;width:29.487499px;" version="1.1" viewbox="0 0 29.487499 10.575" width="29.487499" xmlns="http://www.w3.org/2000/svg">
:平方误差的总和(也称为平方欧氏距离),从而导致最小化的功能:<年代p一个ncl作为年代=”equation" id="EEq2">
经nonnegativity约束元素<年代vghe我ght=”16。2875" id="M33" style="vertical-align:-4.77652pt;width:23.375px;" version="1.1" viewbox="0 0 23.375 16.2875" width="23.375" xmlns="http://www.w3.org/2000/svg">
和<年代vghe我ght=”16。2875" id="M34" style="vertical-align:-4.77652pt;width:22.700001px;" version="1.1" viewbox="0 0 22.700001 16.2875" width="22.700001" xmlns="http://www.w3.org/2000/svg">
,广义Kullback-Leibler分歧正矩阵:<年代p一个ncl作为年代=”equation" id="EEq3">
主题的nonnegativity矩阵<年代vghe我ght=”10。575" id="M36" style="vertical-align:-0.20064pt;width:17.9625px;" version="1.1" viewbox="0 0 17.9625 10.575" width="17.9625" xmlns="http://www.w3.org/2000/svg">
和<年代vghe我ght=”10。325” id="M37" style="vertical-align:-0.0pt;width:15.175px;" version="1.1" viewbox="0 0 15.175 10.325" width="15.175" xmlns="http://www.w3.org/2000/svg">
。
2.1。经典的算法gydF4y2Ba最受欢迎的数值方法解决NMF的乘法更新算法是优化问题(<一个href=”#B25">11一个>]。特别是,它可以表明,平方欧氏距离测量(<一个href=”#EEq2">2一个>)是nonincreasing根据迭代更新规则中描述的算法<一个href=”http年代://www.newsama.com/journals/acisc/2012/781987/alg1/" target="_blank">1一个>。
| 初始化非负矩阵我><年代vghe我ght=”14.025" id="M38" style="vertical-align:-0.20064pt" version="1.1" viewbox="0 0 31.3375 14.025" width="31.3375" xmlns="http://www.w3.org/2000/svg">
(
0
)
和我><年代vghe我ght=”13.775" id="M39" style="vertical-align:-0.0pt" version="1.1" viewbox="0 0 28.549999 13.775" width="28.549999" xmlns="http://www.w3.org/2000/svg">
(
0
)
|
| 而<我>停止条件并不满意我>做 |
|
|
|
|
| 结束时 |
|
和<年代vghe我ght=”11。725” id="M43" style="vertical-align:-1.49226pt" version="1.1" viewbox="0 0 13.2875 11.725" width="13.2875" xmlns="http://www.w3.org/2000/svg">
⊘
表示阿达玛的产品,这是element-wise矩阵 |
| 乘法和element-wise部门分别} |
|