在本文中,我们提出一个方法来构建先验知识NMF的解决问题。我们选择一个先验分布<我nline-formula>
p
D
,
H
(
D
,
H
)
因素模型中,之前,吸引了我们的信念和我们所寻求的解决方案的不确定性。然后我们计算出最大后验(MAP)估计的因素。使用贝叶斯规则,后是由(6)
p
D
,
H
∣
X
(
D
,
H
∣
X
)
=
p
X
|
D
,
H
(
X
∣
D
,
H
)
p
D
,
H
(
D
,
H
)
p
X
(
X
)
。
由于分子是常数,负对数后的总和是一个术语,惩罚可能性模型不适应环境的人,和之前的术语,惩罚的解决方案之前,不太可能在:(7)
ℒ
D
,
H
∣
X
(
D
,
H
)
∝
ℒ
X
|
D
,
H
(
D
,
H
)
+
ℒ
D
,
H
(
D
,
H
)
。
地图的估计<我nline-formula>
D
和<我nline-formula>
H
是(8)
{
D
地图
,
H
地图
}
=
参数
最小值
D
,
H
≥
0
ℒ
D
,
H
∣
X
(
D
,
H
)
,
它又可以计算使用任何合适的优化算法。<年代tatement id="ex2">
例2(非负稀疏编码)。
地图NMF的例子非负稀疏编码(NNSC) [
9,
22),之前<我nline-formula>
H
i.i.d.指数,之前<我nline-formula>
D
是平的,每一列约束单位规范(9)
p
D
,
H
NNSC
(
D
,
H
)
=
∏
我
,
j
λ
经验值
(
−
λ
H
我
,
j
)
,
∥
D
k
∥
=
1
∀
k
,
在哪里<我nline-formula>
|
|
D
k
|
|
欧几里得范数的吗<我nline-formula>
k
th
列的<我nline-formula>
D
。这对应于以下惩罚项的成本函数:(10)
ℒ
D
,
H
NNSC
(
D
,
H
)
∝
λ
∑
我
,
j
H
我
,
j
。
梯度对之前的负对数<我nline-formula>
H
然后(11)
∇
H
ℒ
D
,
H
NNSC
=
λ
,
和梯度<我nline-formula>
D
是零,进一步规范化约束了(
9)。
2.3。高斯过程先验
在下面,我们推导出地图估计在非负矩阵的假设下<我nline-formula>
D
和<我nline-formula>
H
独立是由高斯过程(
18)通过一个链接功能。高斯过程框架提供了原则和实践的规范方法的先验概率分布因素NMF模型。事先指定的两个函数:(i)的协方差函数,描述corellations因素和(2)一个链接功能,将之前的高斯过程转换成所需的分布在非负实数。
我们假设<我nline-formula>
D
和<我nline-formula>
H
是独立的,这样我们可以写吗(12)
ℒ
D
,
H
(
D
,
H
)
=
ℒ
D
(
D
)
+
ℒ
H
(
H
)
。
在下面,我们只考虑前<我nline-formula>
H
,因为治疗<我nline-formula>
D
相当于由于NMF的对称性问题。我们假设有一个潜在变量向量,<我nline-formula>
h
∈
ℝ
l
米
,这是为多元高斯协方差矩阵<我nline-formula>
Σ
h
:(13)
p
h
(
h
)
=
(
2
π
|
Σ
h
|
2
)
−
(
1
/
2
)
N
l
经验值
(
−
1
2
h
⊤
Σ
h
−
1
h
)
,
,与<我nline-formula>
H
通过一个链接功能,<我nline-formula>
f
h
:<我nline-formula>
ℝ
+
→
ℝ
作为(14)
h
=
f
h
(
vec
(
H
)
)
,
运营element-wise输入。的<我nline-formula>
vec
(
⋅
)
函数表达式中操作数栈的矩阵列的列。应该严格增加链接功能,确保了逆的存在。之后,我们将进一步假设的衍生品<我nline-formula>
f
h
和<我nline-formula>
f
h
−
1
存在。在这些假设下,之前结束<我nline-formula>
H
是由(使用变量的变化定理)(15)
p
H
(
H
)
=
p
h
(
f
h
(
vec
(
H
)
)
)
|
(
f
h
(
vec
(
H
)
)
)
|
∝
经验值
(
−
1
2
f
h
(
vec
(
H
)
)
⊤
Σ
h
−
1
f
h
(
vec
(
H
)
)
)
∏
我
|
f
h
”
(
vec
(
H
)
)
|
我
,
在哪里<我nline-formula>
(
⋅
)
表示雅可比矩阵和行列式<我nline-formula>
f
h
”
是链接的函数的导数。然后之前的负对数(16)
ℒ
H
(
H
)
∝
1
2
f
h
(
vec
(
H
)
)
⊤
Σ
h
−
1
f
h
(
vec
(
H
)
)
−
∑
我
日志
|
f
h
”
(
vec
(
H
)
)
|
我
。
这个表达式可以加上适当的似然函数,如最小二乘(可能性
4),可以优化产量地图解决方案;然而,在我们的实验中,我们发现一个更简单的和健壮的算法可以获得通过改变变量,下面将对此进行说明。
2.4。优化变量的变化
而在非负因素优化<我nline-formula>
D
和<我nline-formula>
H
我们介绍了变量<我nline-formula>
δ
和<我nline-formula>
η
,这是相关的<我nline-formula>
D
和<我nline-formula>
H
通过(17)
D
=
g
d
(
δ
)
=
vec
−
1
(
f
d
−
1
(
C
d
⊤
δ
)
)
,
H
=
g
h
(
η
)
=
vec
−
1
(
f
h
−
1
(
C
h
⊤
η
)
)
,
在哪里<我nline-formula>
vec
−
1
(
⋅
)
函数映射的向量输入到一个矩阵适当大小。的矩阵<我nline-formula>
C
d
和<我nline-formula>
C
h
是矩阵的平方根(柯列斯基分解)的协方差矩阵<我nline-formula>
Σ
d
和<我nline-formula>
Σ
h
,这样<我nline-formula>
δ
和<我nline-formula>
η
是标准的高斯先验知识。
改变变量的先验分布<我nline-formula>
η
是(18)
p
η
(
η
)
=
p
H
(
g
h
(
η
)
)
|
(
g
h
(
η
)
)
|
=
1
(
2
π
)
l
米
/
2
经验值
(
−
1
2
η
⊤
η
)
,
和之前的负对数(19)
ℒ
η
(
η
)
∝
1
2
η
⊤
η
。
计算估计的地图转换变量,之前,我们必须把这个表达式(和之前的类似的表达式<我nline-formula>
δ
与似然函数),相同的变量(20)
ℒ
δ
,
η
∣
X
(
δ
,
η
)
=
ℒ
X
∣
D
,
H
(
g
d
(
δ
)
,
g
h
(
η
)
)
+
1
2
δ
⊤
δ
+
1
2
η
⊤
η
。
然后,可以找到地图解决方案通过优化<我nline-formula>
δ
和<我nline-formula>
η
作为(21)
{
δ
地图
,
η
地图
}
=
参数
最小值
δ
,
η
ℒ
δ
,
η
∣
X
(
δ
,
η
)
,
最后,估计的<我nline-formula>
D
和<我nline-formula>
H
可以计算使用(
17)。<年代tatement id="ex3">
例3(最小二乘非负矩阵分解与高斯过程先验(GPP-NMF))。
如果我们使用最小二乘(可能性
4),后验分布(
20.)是由(22)
ℒ
δ
,
η
∣
X
LS
量
GPP
(
δ
,
η
)
=
1
2
(
σ
N
−
2
∥
X
−
g
d
(
δ
)
g
h
(
η
)
∥
F
2
+
δ
⊤
δ
+
η
⊤
η
)
。
地图的估计<我nline-formula>
δ
和<我nline-formula>
η
发现通过最小化这个表达式,导数是有用的吗(23)
∇
η
ℒ
δ
,
η
∣
X
LS
量GPP
(
δ
,
η
)
=
σ
N
−
2
(
vec
(
g
d
(
δ
)
⊤
(
g
d
(
δ
)
g
h
(
η
)
−
X
)
)
⊙
(
f
h
−
1
)
”
(
C
h
⊤
η
)
)
⊤
C
h
+
η
,
在哪里<我nline-formula>
⊙
表示阿达玛(element-wise)产品。的导数<我nline-formula>
δ
由于对称NMF类似问题。
2.5。链接功能
任何严格增加链接功能,地图的非负实数实线可用于拟议的框架;然而,为了有一个更好的先验分布的概率解释,我们提出一个简单的原则选择链接功能。我们选择这样的链接功能<我nline-formula>
f
h
−
1
地图元素的边缘分布的高斯过程向量<我nline-formula>
h
到一个特别选择元素的边缘分布<我nline-formula>
H
。可以找到这样一个逆函数<我nline-formula>
f
h
−
1
(
h
我
)
=
P
H
−
1
(
P
h
(
h
我
)
)
,在那里<我nline-formula>
P
(
⋅
)
表示边际累积分布函数(CDFs)。
因为高斯过程的人是高斯分布,<我nline-formula>
P
h
(
h
我
)
是高斯(CDF),使用(
13)的反向链接功能(24)
f
h
−
1
(
h
我
)
=
P
H
−
1
(
1
2
+
1
2
Φ
(
h
我
2
σ
我
)
)
,
在哪里<我nline-formula>
σ
我
2
是<我nline-formula>
我
th对角元素的<我nline-formula>
Σ
h
和<我nline-formula>
Φ
(
⋅
)
误差函数。<年代tatement id="ex4">
示例4 (exponential-to-Gaussian链接功能)。
如果我们选择指数的人<我nline-formula>
H
,如NNSC中描述的例子
2,我们选择<我nline-formula>
P
H
随着指数提供。反向链接功能(25)
f
h
−
1
(
h
我
)
=
−
1
λ
日志
(
1
2
−
1
2
Φ
(
h
我
2
σ
我
)
)
,
在哪里<我nline-formula>
λ
是一个逆尺度参数。反向链接函数的导数,所需的参数估计,给出了(26)
(
f
h
−
1
)
”
(
h
我
)
=
1
2
π
σ
我
λ
经验值
(
λ
f
h
−
1
(
h
我
)
−
h
我
2
2
σ
我
2
)
。
示例5 (rectified-Gaussian-to-Gaussian链接功能)。
另一个有趣的非负分布的修正高斯(27)
p
(
x
)
=
{
2
2
π
年代
经验值
(
−
x
2
2
年代
2
)
,
x
≥
0
,
0
,
x
<
0。
使用这个pdf (
24),反向链接功能(28)
f
h
−
1
(
h
我
)
=
2
年代
Φ
−
1
(
1
2
+
1
2
Φ
(
h
我
2
σ
我
)
)
,
和反向链接函数的导数(29)
(
f
h
−
1
)
”
(
h
我
)
=
年代
2
σ
我
经验值
(
f
h
−
1
(
h
我
)
2
2
年代
2
−
h
我
2
2
σ
我
2
)
。
2.6。摘要GPP-NMF方法
GPP-NMF方法可以归纳为如下步骤。
(我)
选择一个合适的负对数似函数<我nline-formula>
ℒ
X
∣
D
,
H
(
D
,
H
)
基于知识的分布数据或剩余。
(2)
每个非负的因素<我nline-formula>
D
和<我nline-formula>
H
,选择合适的链接和协方差函数根据你之前的信仰。如果有必要,把样本先验分布调查其属性。
(3)
计算估计的地图<我nline-formula>
δ
和<我nline-formula>
η
由(
21)使用任何合适的无约束优化算法。
块估计因素是显示在图
2。的因素估计LS-NMF和CNMF方法出现噪声和非光滑,而光滑GPP-NMF估计的因素。LS-NMF方法估计的因素有积极的偏见,因为负面数据的截断。GPP-NMF与不正确的之前有太多地方极值<我nline-formula>
D
因素和太少<我nline-formula>
H
因素由于不正确的协方差函数。只有微小差别的结果GPP-NMF之前使用正确的和潜在的因素。
潜在的负的因素在玩具的例子:列<我nline-formula>
D
(左)和行<我nline-formula>
H
(右)。LS-NMF和发现的因素CNMF算法是喧闹的,而GPP-NMF方法发现的因素是光滑的。使用正确的前时,发现非常类似于真正的因素的因素。
(一)
(b)