求解广义的线性矩阵方程(GLME)及其变体是科学和工程领域的广泛遇到的一个重要问题(例如,反馈控制系统设计[
1],智能天线阵列处理[
2])。众所周知的Lyapunov方程和Sylvester方程可以被视为GLME的主要特殊情况,具有减少的系数和可变矩阵,这对过去几十年来说已经吸引了研究人员和工程师的广泛兴趣[
3.-
7.]. 在不丧失一般性的情况下,在本简介中,GLME问题的表述形式如下:
(1)
∑
L.
=
1
P.
一种
L.
X
B.
L.
=
C
那在哪里
一种
L.
∈
R.
m
×
m那
B.
L.
∈
R.
N
×
N, 和
C
∈
R.
m
×
N表示系数矩阵和
X
∈
R.
m
×
N表示要获得的未知矩阵。通常情况下,分析解决问题的方法很复杂(
1)将以传统的数值方式进行。保证此类glme(
1)用唯一的理论解,系数矩阵可解
一种
L.
∈
R.
m
×
m和
B.
L.
∈
R.
N
×
N实际上它们的特征值都可以同时为正或负。在许多情况下,(
1)可以是多个或甚至没有,这取决于哪种组合矩阵
一种
L.和
B.
L.将与未知矩阵相关联
X.许多传统的串行方法由于其固有的缺陷可能不足以有效地解决在线GLME,并行计算方法似乎更可取[
8.-
13].
在本节中,我们展示并分析了经常性神经网络的一般模型来解决glme(
1). 如果该模型由线性函数激活,则状态矩阵
X
(
T.
)
∈
R.
m
×
N一般递归神经网络的全局收敛性和指数收敛性都是唯一的理论解
X
∗
∈
R.
m
×
N.通过利用特定的非线性奇数单调增加的激活功能,预计会达到优异的收敛性。在随后的小节中,我们将与其线性形式一起讨论通用非线性复发神经网络模型的收敛性。
2.1。一般非线性神经网络模型
本文提出了求解GLME的一般非线性递归神经网络模型(
1)详情如下:
(2)
X
˙
T.
=
-
γ
∑
R.
=
1
P.
一种
R.
T.
F
∑
S.
=
1
P.
一种
S.
X
T.
B.
S.
-
C
B.
R.
T.
那在运营商
F
(
·
)
:
R.
m
×
N
→
R.
m
×
N为非线性激活函数数组,其每个标量值映射单元
F
(
·
)
:
R.
→
R.是一个单调增加的奇数激活函数和下标
(
·
)
T.表示矩阵/向量的转置。递归神经网络模型(
2)可以作为经常性神经网络的延长非线性版本概括[
16[随后的线性模型。对于一般非线性复发性神经网络模型(
2),我们将有以下定理。
定理1。
神经状态矩阵
X
(
T.
)
∈
R.
m
×
N一般非线性递归神经网络模型的研究(
2)从任何初始值开始
X
(
0.
)
∈
R.
m
×
N,可以全局收敛到理论解
X
∗
∈
R.
m
×
NGLME公司(
1).
证明。
首先,我们定义神经状态与理论解决方案之间的距离
X
〜
(
T.
)
=
X
(
T.
)
-
X
∗
∈
R.
m
×
N.因此,用
X
(
T.
)
=
X
〜
(
T.
)
+
X
∗
∈
R.
m
×
N进入神经网络模型(
2),则可进一步等价转换为
(3)
X
〜
˙
T.
=
-
γ
∑
R.
=
1
P.
一种
R.
T.
F
∑
S.
=
1
P.
一种
S.
X
〜
T.
B.
S.
B.
R.
T.
.接下来,相应的Lyapunov函数候选定义如下:
(4)
V.
X
〜
T.
那
T.
3.
=
X
〜
T.
F
2
=
V.
E.
C
X
〜
T.
2
2
那在哪里运营商
·
F那
·
2, 和
⊗分别表示矩阵的Frobenius规范,两种载体标准和矩阵之间的克朗克蛋白产品
V.
E.
C
(
X
〜
(
T.
)
)
∈
R.
m
N生成通过堆叠所有列向量获得的新列向量
X
〜
(
T.
)
∈
R.
m
×
N一起。
时间衍生
V.
(
X
〜
(
T.
)
那
T.
)
(
3.
)是
(5)
V.
˙
X
〜
T.
那
T.
3.
=
2
V.
E.
C
X
〜
T.
T.
V.
E.
C
X
〜
˙
T.
.
考虑以下导航平等(基于)(
2),
(6)
V.
E.
C
X
〜
˙
T.
=
-
γ
∑
R.
=
1
P.
B.
R.
⊗
一种
R.
T.
F
∑
S.
=
1
P.
B.
S.
T.
⊗
一种
S.
V.
E.
C
X
〜
T.
那我们可以进一步推导(
5.)作为
(7)
V.
˙
X
〜
T.
那
T.
3.
=
-
2
γ
V.
E.
C
X
〜
T.
T.
∑
R.
=
1
P.
B.
R.
⊗
一种
R.
T.
·
F
∑
S.
=
1
P.
B.
S.
T.
⊗
一种
S.
V.
E.
C
X
〜
T.
=
-
2
γ
∑
L.
=
1
P.
B.
L.
T.
⊗
一种
L.
V.
E.
C
X
〜
T.
T.
·
F
∑
L.
=
1
P.
B.
L.
T.
⊗
一种
L.
V.
E.
C
X
〜
T.
.
为非线性激活函数阵列
F
(
·
),其单独的标量标值
F
(
·
)是奇怪的,单调地增加,可以保证
(8)
你
F
你
=
>
0.
那
你
∈
R.
那
你
≠
0.
;
=
0.
那
你
∈
R.
那
你
=
0.
.因此
V.
˙
(
X
〜
(
T.
)
那
T.
)
(
3.
)
⩽
0.,这意味着
X
〜
(
T.
)
∈
R.
m
×
N全局会聚到零矩阵
0.
∈
R.
m
×
N根据Lyapunov理论的说法[
20.];也就是说,州矩阵
X
(
T.
)
∈
R.
m
×
N的 (
2)全球收敛于理论解决方案
X
∗
∈
R.
m
×
NGLME公司(
1).所有这些以上都完成了证明。
解决GLME (
1),我们首先定义了标量标值的错误功能
E.
(
T.
)
=
∑
L.
=
1
P.
一种
L.
X
(
T.
)
B.
L.
-
C
F
2
/
2
∈
[
0.
那
+
∞
)有关联 (
1),运营商
·
F代表Frobenius规范。以消除误差函数
E.
(
T.
)归零为
T.增加,采用梯度下降方式:
(9)
X
˙
T.
=
-
γ
∂
E.
T.
∂
X
T.
那设计参数的地方
γ
>
0.缩放收敛速度。
根据矩阵微分理论的预备知识[
22], (
9.)进一步扩展为以下动态形式:
(10)
X
˙
T.
=
-
γ
∑
S.
=
1
P.
∑
R.
=
1
P.
一种
R.
T.
一种
S.
X
T.
B.
S.
B.
R.
T.
+
γ
∑
L.
=
1
P.
一种
L.
T.
C
B.
L.
T.
.
线性模型(
10),我们将有以下定理。
定理2。
如果是线性神经网络模型(
10)用于求解GLME(
1),从初始条件开始
X
(
0.
)
∈
R.
m
×
N,状态矩阵
X
(
T.
)
∈
R.
m
×
N的 (
10)可以全局指数收敛到唯一的理论解
X
∗
∈
R.
m
×
N.
证明。
使用转换
X
〜
(
T.
)
=
X
(
T.
)
-
X
∗
∈
R.
m
×
N之间
X
(
T.
)和
X
∗初始条件
X
〜
(
0.
)
=
X
(
0.
)
-
X
∗
∈
R.
m
×
N,动力学方程(
10)进一步等效推导如下:
(11)
X
〜
˙
T.
=
-
γ
∑
S.
=
1
P.
∑
R.
=
1
P.
一种
R.
T.
一种
S.
X
〜
T.
B.
S.
B.
R.
T.
+
γ
∑
L.
=
1
P.
一种
L.
T.
C
B.
L.
T.
-
γ
∑
S.
=
1
P.
∑
R.
=
1
P.
一种
R.
T.
一种
S.
X
∗
B.
S.
B.
R.
T.
=
-
γ
∑
S.
=
1
P.
∑
R.
=
1
P.
一种
R.
T.
一种
S.
X
〜
T.
B.
S.
B.
R.
T.
+
γ
∑
R.
=
1
P.
一种
R.
T.
C
-
∑
S.
=
1
P.
一种
S.
X
∗
B.
S.
B.
R.
T.
.
和
∑
L.
=
1
P.
一种
L.
X
∗
B.
L.
=
C考虑到(
11)可以简化为
(12)
X
〜
˙
T.
=
-
γ
∑
S.
=
1
P.
∑
R.
=
1
P.
一种
R.
T.
一种
S.
X
〜
T.
B.
S.
B.
R.
T.
.
同样,我们定义以下Lyapunov-Function候选者:
(13)
V.
X
〜
T.
那
T.
10
=
X
〜
T.
F
2
⩾
0.
那它的时间导数是
(14)
V.
˙
X
〜
T.
那
T.
10
=
T.
R.
一种
C
E.
∂
V.
X
〜
T.
那
T.
∂
X
〜
T.
T.
X
〜
˙
T.
=
T.
R.
一种
C
E.
-
2
γ
X
〜
T.
T.
∑
S.
=
1
P.
∑
R.
=
1
P.
一种
R.
T.
一种
S.
X
〜
T.
B.
S.
B.
R.
T.
=
-
2
γ
∑
L.
=
1
P.
一种
L.
X
〜
T.
B.
L.
F
2
⩽
0.
.存在一个正标量
α
>
0.[
23]是最小的特征值
(
∑
L.
=
1
P.
B.
L.
T.
⊗
一种
L.
)
T.
(
∑
L.
=
1
P.
B.
L.
T.
⊗
一种
L.
)满意
(15)
∑
L.
=
1
P.
一种
L.
X
〜
T.
B.
L.
F
2
⩾
α
X
〜
T.
F
2如果glme的独特解决方案条件(
1)坚持住。因此,我们可以
(16)
V.
˙
X
〜
T.
那
T.
⩽
-
2
γ
α
V.
X
〜
T.
那
T.
;那是,
(17)
V.
X
〜
T.
那
T.
⩽
经验值
-
2
γ
α
T.
V.
X
〜
0.
那
0.
那可以进一步等效地重写为
(18)
X
T.
-
X
∗
F
⩽
经验值
-
γ
α
T.
X
0.
-
X
∗
F
.
由Lyapunov理论[
20.], (
14) 和 (
18)表示状态矩阵
X
(
T.
)
∈
R.
m
×
N的 (
10)可以全局和指数收敛到唯一的理论解
X
∗
∈
R.
m
×
NGLME公司(
1).这样证明是完整的。
值得注意的是,如果glme(
1)具有多种理论解
X
∗
∈
R.
m
×
N,标量
α等于零。在这种情况下,线性模型(
10)至少可以保证其全球融合,但不能明确指数收敛速度。
一般递归神经网络模型(
2)使用三种类型的激活功能:线性,功率和(
N
=
3.)和双曲正弦(
ξ
=
3.).
定理3。
如果是一般复发性神经网络(
2)由幂和函数激活
F
(
你
)
=
∑
K.
=
1
N
你
2
K.
-
1,状态矩阵
X
(
T.
)
∈
R.
m
×
N的 (
2)可以全局优收敛到唯一的理论解
X
∗
∈
R.
m
×
N,与线性模型相比(
10).
证明。
为了证明(
2)由Power Sum函数激活
F
(
你
)
=
∑
K.
=
1
N
你
2
K.
-
1在这种情况下,我们定义以下lyapunov函数候选:
(19)
V.
P.
S.
X
〜
T.
那
T.
≔
V.
X
〜
T.
那
T.
3.
=
V.
X
〜
T.
那
T.
10
那它的时间导数是
(20)
V.
˙
P.
S.
X
〜
T.
那
T.
=
-
2
γ
Δ
T.
F
Δ
=
-
2
γ
∑
一世
=
1
m
N
Δ
一世
F
Δ
一世
=
-
2
γ
∑
一世
=
1
m
N
Δ
一世
∑
K.
=
1
N
Δ
一世
2
K.
-
1
=
-
2
γ
∑
一世
=
1
m
N
∑
K.
=
1
N
Δ
一世
2
K.
⩽
-
2
γ
∑
一世
=
1
m
N
Δ
一世
2
=
V.
˙
X
〜
T.
那
T.
10
那在哪里
(21)
Δ
=
Δ
1
那
Δ
2
那
......
那
Δ
一世
那
......
那
Δ
m
N
T.
∈
R.
m
N和
Δ
一世
∈
R.表示
一世向量的第Th元素
(
∑
L.
=
1
P.
B.
L.
T.
⊗
一种
L.
)
V.
E.
C
(
X
〜
(
T.
)
)
∈
R.
m
N.这意味着在使用电源和函数时(
2)具有对零矩阵的全局收敛性,与一般情况相比,具有更大的李雅普诺夫函数消失率(即更快的收敛速度)(
10).这样证明是完整的。
定理4。
如果是一般复发性神经网络(
2)被双曲正弦函数激活
F
(
你
)
=
经验值
(
ξ
你
)
/
2
-
经验值
(
-
ξ
你
)
/
2有系数
ξ
⩾
1,状态矩阵
X
(
T.
)
∈
R.
m
×
N的 (
2)可以全局优收敛到唯一的理论解
X
∗
∈
R.
m
×
N,与线性模型(
10).
证明。
同样,定义Lyapunov函数来研究收敛性:
(22)
V.
H
S.
X
〜
T.
那
T.
≔
V.
P.
S.
X
〜
T.
那
T.
=
V.
X
〜
T.
那
T.
10
那它的时间衍生是
(23)
V.
˙
H
S.
X
〜
T.
那
T.
=
-
2
γ
∑
一世
=
1
m
N
Δ
一世
F
Δ
一世
=
-
γ
∑
一世
=
1
m
N
Δ
一世
经验值
ξ
Δ
一世
-
经验值
-
ξ
Δ
一世
=
-
2
γ
∑
一世
=
1
m
N
∑
j
=
1
+
∞
ξ
Δ
一世
2
j
2
j
-
1
!!
⩽
-
2
γ
∑
一世
=
1
m
N
Δ
一世
2
=
V.
˙
X
〜
T.
那
T.
10
那这表明当采用双曲正弦激活函数时,非线性递归神经网络模型(
2)与线性模型的情况相比,具有全局矩阵接近零,随着状态矩阵接近零,具有较大的Lyapunov功能消失率(即,更快的收敛)(
10).这些完成了证明。
让我们考虑下面的GLME
L.
=
2:
(24)
一种
1
X
B.
1
+
一种
2
X
B.
2
=
C
那在哪里
(25)
一种
1
=
2
1
1
3.
那
一种
2
=
6.
2
3.
4.
那
B.
1
=
5.
3.
3.
4.
那
B.
2
=
6.
2
5.
8.
那
C
=
3.
4.
5.
6.
.
GLME(
24)具有独特的理论解决方案
(26)
X
∗
=
-
0.0023
0.0308
0.0395
0.1019
那由于系数矩阵的特征值
一种
1那
一种
2那
B.
1, 和
B.
2都是正值。我们采用一般的递归神经网络模型(
2) 和
γ
=
1通过线性函数激活,功率和功能
N
=
4.和双曲正弦功能
ξ
=
3..
从图中
2,我们可以观察到解的错误
X
(
T.
)
-
X
∗
F在0.02左右降至几乎为零 采用幂和和函数和双曲正弦激活函数,可以获得更高的精度和更快的收敛速度(
2).这些可以证明一般递归神经网络模型(
2)用于解决glme(
24).
解决方案错误
X
(
T.
)
-
X
∗
F合成(
2)为GLME (
24)与独特的理论解决方案
X
∗,从相同的随机生成的初始状态开始
X
(
0.
)
∈
R.
2
×
2.
例2。
让我们考虑以下多种理论解决方案的GLME
X
∗
∈
R.
2
×
2:
(27)
一种
〜
1
X
B.
〜
1
+
一种
〜
2
X
B.
〜
2
=
C
〜
那在哪里
(28)
一种
〜
1
=
1
0.
-
1
1
那
一种
〜
2
=
2
0.
0.
1
那
B.
〜
1
=
0.
0.
0.
1
那
B.
〜
2
=
0.
1
0.
0.
那
C
〜
=
0.
3.
0.
5.
.
我们使用线性模型(
10)带设计参数
γ
=
1解决glme(
27).状态矩阵元素的轨迹
X
(
T.
)
∈
R.
2
×
2如图所示
3..从图中
3.,我们可以看到,从两个不同的初始矩阵开始
X
(
0.
)
∈
R.
2
×
2,状态矩阵
X
(
T.
)
∈
R.
2
×
2线性模型的应用(
10)分别收敛到两个不同的轨迹(或者说两个不同的理论解)
X
∗
∈
R.
2
×
2). 这表明初始值的选择对递归神经网络的稳态结果影响很大(
2)并确定GLME溶液的收敛点(
27),如果GLME存在多种理论解决方案(
27). 相应地,剩余误差
一种
〜
1
X
(
T.
)
B.
〜
1
+
一种
〜
2
X
(
T.
)
B.
〜
2
-
C
〜
F合成(
10)总能在有限时间内从20个不同的初始值减小到零,如图所示
4..
国家矩阵的轨迹
X
(
T.
)
∈
R.
2
×
2解决glme(
27)具有多种理论解决方案
X
∗,从两个不同的初始状态开始
X
(
0.
)
∈
R.
2
×
2.
剩余错误
一种
〜
1
X
(
T.
)
B.
〜
1
+
一种
〜
2
X
(
T.
)
B.
〜
2
-
C
〜
F合成(
2)用于GLME的解决方案(
27)从二十个不同的初始状态开始
X
(
0.
)
∈
R.
2
×
2.
例3。
让我们在更大的维度中考虑以下GLME
L.
=
10:
(29)
∑
L.
=
1
10
一种
L.
X
B.
L.
=
C
那其中系数矩阵
一种
L.
∈
R.
10
×
10那
B.
L.
∈
R.
10
×
10, 和
C
∈
R.
10
×
10是否所有正定值都是随机生成的,并且都在区间内
[
-
2,2
]
∈
R.
10
×
10.我们利用非线性神经网络模型(
2)由功率和和双曲正弦函数和线性模型激活(
10)解决glme(
29)带设计参数
γ
=
1.从表
1,我们可以观察到一般的递归神经网络模型(
2)与线性模型相比,由幂和和和双曲正弦激活函数激活的模型具有更快的误差衰减速度(
10),所有剩余错误都达到了达到的水平
10
-
7.在1 s。从以上三个例子的计算结果可以看出,所提出的一般非线性递归神经网络可以求解GLME (
1)问题良好。