文摘

使用之间的关系主要与几何矩阵及其逆平方根的意思是,我们提供一个快速算法计算两个埃尔米特矩阵正定的几何平均数。该算法稳定、具有较高的收敛阶。一些实验包括支持拟议的计算算法。

1。介绍

本文试图提供一个快速算法寻找两个埃尔米特矩阵正定的几何平均通过矩阵符号函数的应用。众所周知,标量算术几何的意思 两个非负数字 被定义为从吗 然后迭代 直到 到所需的精度。标量的序列 , 收敛于对方。注意,在(1), 两个正数的几何平均数吗 每个计算周期。虽然迭代公式非常简单和可靠的两个标量,它扩展通用广场和满秩矩阵不是一项容易的任务。在这项工作中,我们关心的是埃尔米特矩阵的两个广场正定矩阵。

正确的定义矩阵几何平均数 两个正定矩阵 可以表达的 给定一个方阵在哪里 没有真正负的特征值, 表示二次矩阵方程的唯一解 其特征在于正确的半平面。定义(2)是在年代Pusz和Woronowicz1]。还有一些其他的重要定义计算两个矩阵的矩阵几何平均;例如,看到Lawson-Lim[工作2]。注意,当只涉及两个矩阵理论是发达的,但如果发现超过两个矩阵的矩阵几何平均数,配方是一种硬;看到更多的3]。

制定一个变体的标量的几何平均数可以表达的

可以看到在(4),标量几何平均数的计算是完全相关的平方根积极的标量 和它的逆矩阵。类似的和重要的定义一个矩阵几何平均被巴蒂亚(开发和建议4)如下: 两个埃尔米特矩阵正定(HPD) 。我们使用的符号 显示两个HPD矩阵的几何平均数。

注意,公式(2)和(5)一致,都是平等的。更多信息,请参考[5]。

本文的其余部分组织如下。节2我们结合root-finding牛顿法和Chebyshev-Halley-type方法设计一种快速求解非线性方程迭代公式。节3我们提供了解决非线性方程之间的联系和一些特殊矩阵的计算功能。这将说明如何构建新的算法和实现。的实现提出了迭代公式在数学符号软件(6)一起讨论方案的稳定性将提供。注意,计算几何平均数的概念使用符号函数也可以发现在7]。节4我们展示了数值结果和突出的利益提出了技术。结论部分5

2。建设一个新的方法

众所周知,共同为提高迭代的收敛速度的方法解决非线性标量方程光滑结合已经开发计划。因此,让我们先将著名的牛顿法结合到一个特殊的方法Chebyshev-Halley-type计划(8获得一个新的迭代方案如下: 。关于非线性方程的获得背景,你可以咨询(9,10]。

定理1。 是一个简单的零的充分可微函数 一个开区间 ,其中包含 作为一个初始近似 。然后,迭代表达式(6下面没有内存满足误差方程 ,

证明。这个定理的证明是基于泰勒级数展开迭代法(6)的解决方案 迭代。节省空间,而不是将注意力从主要的话题,我们这里排除证据。证明的步骤类似于那些在(11]。

迭代法(6)达到sixth-order收敛使用五个功能评估,从而达到效率指数 ,这是高于牛顿;也就是说, 。此外,应用(6)求解多项式方程 有全局收敛性(除了躺在虚轴上的点)。这个全球行为可以很容易地显示通过吸引力的盆地(6) 是有用的在实际矩阵问题,允许我们处理各种各样的HPD与任何光谱矩阵。

备注2。注意,自全球行为可以观察到盆地的景点,然后我们不追求这个事实通过理论分析(6)。

最近的讨论之间的关系矩阵信号并给出解决非线性方程(12,13]。我们国家所有的扩展在标量情况下和学习他们的订单是象征性的计算性质。这样一个扩展矩阵环境也将在下一节中使用符号计算。

3所示。建筑几何平均数的一种算法

部分之间的关系2和我们的主要目的计算矩阵几何平均数不清楚一见钟情。为了说明这一点,我们回忆起,许多重要的矩阵等功能矩阵的平方根,也就是说,解矩阵方程(3),矩阵符号函数下面的矩阵方程的解: 可以通过矩阵迭代计算近似函数。这样定点类型方法在特殊条件下收敛到目标矩阵函数,基本上是源于root-finding方法(7]。

另一方面,重要的矩阵几何平均数的定义(5)需要计算矩阵的平方根 和它的逆矩阵。因此,为了设计一个高效的算法(5),我们希望构造迭代表达式的计算 在同一时间。

朝着这一目标,我们应用新的非线性方程解算器(6)求解矩阵方程(8)。这个应用程序将产生以下矩阵迭代互惠的形式: 用一个合适的 寻找符号矩阵。

备注3。迭代(9)不是Pade家庭成员的迭代中引入[14为矩阵的迹象。

为了连接(9),我们的目标,我们提醒一个重要的身份如下(7]: 这表明一个重要主体之间的关系矩阵的平方根 和矩阵符号函数。

身份(10)有一个优势是主要的逆矩阵的平方根的计算以及校长同时矩阵的平方根。让我们在接下来的第一个研究稳定的行为(9)。

引理4。 没有特征值 。然后,序列 由(9)使用 是渐近稳定的。

证明。 是一个数值摄动的介绍 th迭代(9)。我们获得 所有条款在他们的错误是远离我们的二次分析。这正式操作是有意义的 是足够小。我们有 注意之间的交换性 不使用在这个引理。简化这个问题,以下将使用身份(满秩矩阵 和矩阵 ): 简化的收益率 在哪里 , ,足够的大 ,我们假设 。经过一些代数操作和使用 ,我们得出这样的结论: 应用(15)递归,我们有 从(16),我们可以得出结论,在迭代摄动 是有界的。这允许得出在给定的步骤是有界扰动的后续步骤。因此,序列 由(9)是渐近稳定的。

请注意,引理4只是显示了渐近稳定。一般来说,定点迭代 稳定在一个社区定点 如果邻导 有限的权力(7]。此外,如果 任何超线性收敛的迭代吗 ,然后 ,在那里 是邻矩阵符号函数的导数在哪里 。因此 幂等( )和迭代是稳定的,因此所有信号迭代,如(9),自动稳定。

现在很容易推断出下面的收敛定理(9)。

定理5。 没有特征值 。如果 ,然后迭代方法(9)收敛于

证明。理性迭代的收敛性分析的矩阵的特征值的收敛性 。这样做的原因是,如果 有一个乔丹分解 ,然后 。让 有一个约旦标准型安排吗 ,在那里 是一个满秩矩阵。它也知道(7] 如果我们定义 ,然后从方法(9),我们得到 注意,如果 是一个对角矩阵,基于归纳证明,都是连续的吗 也是对角。从(18),它是足以证明 收敛于 为了确保所产生的序列的收敛性(9)。
我们可以写(18), 非耦合标量迭代来解决 ,由 在哪里 。从(18)和(19),它足以研究的融合 ,尽管
从(19),自特征值 不是纯粹的想象,我们有吗 。因此,我们获得 ,我们有 。这表明 是收敛的。现在,它可以很容易得出结论 。最后,我们有 证明已经完成。

迭代(9)需要前一个矩阵求逆计算步骤和获得 的兴趣(5)。的实现(9)计算主要根需要一把锋利的关注以节省很多精力。自中间矩阵都是稀疏(至少一半的条目为零),那么可以直接使用稀疏近似技术来节省内存和时间。

的实现(9)来计算 两个HPD矩阵在编程方案提出了Mathematica(算法1)。

ClearAll(“全球*”)
FunM [fun_间]:=模块({假的,昏暗的,mataux JordanD, sim, JordanF,每股收益,
fdiag、diagQ fauxD}(暗= Length@X;
人造(i_ xx_, j_]: =
[我< = j, 1 / Abs (i, j) !(D[有趣,{x, Abs (i, j)})/。x - > xx,真的,0);
mataux [Y_]: =表[人造[Y [[i, j]], i, j],{我,1,暗淡},{j, 1,暗淡}];
JordanD = JordanDecomposition [X]// N;sim = JordanD [[ ]];
JordanF = JordanD [[ ]];每股收益= 1 * 10- - - - - -10;
[JordanF diagQ =标准- - - - - -DiagonalMatrix[对角[JordanF]]];
fauxD [xx_]: =(有趣)/。x - > xx;
(fauxD fdiag: = DiagonalMatrix[地图,对角[JordanF]]];
这[diagQ < eps, sim.fdiag。逆(sim),真的,
sim.mataux [JordanF] .Inverse (sim))))
米高梅(现代、B_ maxIterations_ tolerance_]: =模块({k = 0},
{n, n}=维度[A];Id = SparseArray [ i_ (i_}- > 1。},{n, n}];
A1 = SparseArray@ArrayFlatten [ 0,N@A},{Id, 0 ];Y ( )= A1;
R ( ]= 1;Id2 = SparseArray [ i_ (i_}- > 1。},{2 n, n}];
{Quiet@While [k < maxIterations& &R [k] > =宽容,
Y2 = Y [k] .Y [k];Y3 = Y2.Y [k];Y4 = Y3.Y [k];
日元= Y4.Y [k];日元= Y5.Y [k];日元= Y6.Y [k];日元= Y7.Y [k];
l1 = SparseArray[7日元Y2 Id2 + 148 + 330 + 148日元+ 7日元);
l2 = SparseArray@ArrayFlatten [ Inverse@l1 [[1;;n 1;;n]], 0},
{0,Inverse@l1 [[n + 1;;2 n, n + 1;;2 n]] ];
Y (k + 1) = SparseArray [(48 Y [k] + 272 Y3 + 272日元+ 48日元).l2);
R (k + 1) =规范[[k + 1] - Y [k],无穷)/规范(Y [k + 1],无穷);k + +);
= Y [k] [[1;;n, n + 1;;2 n]];IAS = Y [k] [[n + 1;;2 n 1;;n]];
垫= (IAS.B.IAS)};
作为。FunM [Sqrt (x),垫子]。as]

在算法1,four-argument函数 计算 通过输入四个参数”矩阵 ”、“矩阵 ”、“迭代的最大数量(9)是允许的,”和“容忍”停止终止的无穷范数

请注意,对于计算的主要矩阵的平方根 约旦河,我们使用标准的方法,提供了计算矩阵函数的一般形式的代码

4所示。实验

我们测试了方法(9)用点使用Mathematica 8在机器的精度。除了这个方案,另一个迭代方法,被称为DB方法(15),由 被认为是。这种方法生成的序列 它收敛到 ,分别。

我们的话,第一和第二子步骤(6)导致二次牛顿法(NM)和立方Chebyshev-Halley的方法(CHM)矩阵符号(7在下面:

例6。作为第一个例子,我们考虑矩阵 , ,而它的确切矩阵几何平均数是由(16]:

该方法收敛于解矩阵在2的迭代中,显示了一个完全快速收敛。

例7。我们现在考虑的两个HPD矩阵如下: 和计算

我们比较不同的数值方法和报告结果的行为 对于所有规范涉及停止准则 在图1。可以看到,数值结果与理论相协调方面的部分3并显示该方法的快速收敛(9)而不是DB、纳米和化学加工。

5。结论

基于quadratical牛顿的Chebyshev-Halley方案和体积的方法,我们已经开发出一种迭代法与第六阶收敛求解非线性标量方程光滑。计算效率显示它的优越性与纳米。然后,全局行为寻找矩阵符号函数的方法一直是延长了计算主要矩阵及其逆平方根。这个过程之后,建立一个快速算法寻找两个HPD矩阵的矩阵几何平均数。我们也有研究提出的渐近稳定技术。

为了说明这项新技术提出了一些数值例子。计算结果有合理的健壮和高效的方法的收敛行为。类似的数值实验,进行了大量的不同类型的问题,在很大程度上证实了上述结论。

我们得出结论本文评论,在许多计算中的数值应用高精度是必需的。数值实验的结果表明,高阶等有效的方法(9)与多种精密运算非常有用,因为它们产生明显减少迭代的次数。

利益冲突

作者宣称没有利益冲突有关的出版。

承认

作者感谢匿名评论者仔细阅读本文,帮助改善报告。