CIN 计算智能和神经科学 1687 - 5273 1687 - 5265 Hindawi出版公司 872425年 10.1155 / 2008/872425 872425年 研究文章 扩展的非负张量Factorisation模型为音乐声源分离 菲茨杰拉德 德里 1 Cranitch 马特 1 Coyle 尤金 2 Morup Morten 1 电子工程系 科克理工学院 软木塞 爱尔兰 cit.ie 2 学院电气工程系统 都柏林理工学院,凯文街,都柏林 爱尔兰 dit.ie 2008年 22 04 2008年 2008年 18 12 2007年 03 03 2008年 17 04 2008年 2008年 版权©2008 这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。

最近,移不变的张量factorisation算法已经提出了声源定位乐器分离的目的。然而,在实践中,现有的算法需要使用对数频率谱图允许频率移不变性导致问题试图resynthesise分离来源。此外,很难调和性约束恢复基础功能。本文提出了一种新的添加剂合成方法,允许使用线性频率谱图以及严格谐波限制,导致一种改进的模型。此外,这些额外的约束允许添加源滤波器模型factorisation框架,和一个扩展模型,该模型能够同时分离混合物的定位和敲击乐器。 1。介绍</t我tle> <p>使用factorisation-based方法分离的音乐声音来源可以追溯到1980年代初当Stautner用主成分分析(PCA)分离不同的手鼓中风<xrgydF4y2Baef ref-type="bibr" rid="B4"> 1</xrgydF4y2Baef>]。然而,直到独立分量分析(ICA)的发展<xrgydF4y2Baef ref-type="bibr" rid="B3"> 2</xrgydF4y2Baef>和技术,如稀疏编码<xrgydF4y2Baef ref-type="bibr" rid="B5"> 3</xrgydF4y2Baef>,<xrgydF4y2Baef ref-type="bibr" rid="B6"> 4</xrgydF4y2Baef>)和非负矩阵factorisation (NMF) [<xrgydF4y2Baef ref-type="bibr" rid="B39"> 5</xrgydF4y2Baef>,<xrgydF4y2Baef ref-type="bibr" rid="B40"> 6</xrgydF4y2Baef>]factorisation-based分析和分离的方法获得重视音乐音频信号(<xrgydF4y2Baef ref-type="bibr" rid="B42"> 7</xrgydF4y2Baef>- - - - - -<xrgydF4y2Baef ref-type="bibr" rid="B25"> 11</xrgydF4y2Baef>]。</pgydF4y2Ba> <p>Factorisation-based方法最初是应用于单通道分离的音乐来源(<xrgydF4y2Baef ref-type="bibr" rid="B42"> 7</xrgydF4y2Baef>- - - - - -<xrgydF4y2Baef ref-type="bibr" rid="B22"> 10</xrgydF4y2Baef>),对输入信号进行时频分析,产生一个谱图<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M1"> <mml:mrow> <mml:mstyle mathvariant="bold"> <mml:mi> X</米米l:米我> </mml:mstyle> </mml:mrow> </mml:math> </inline-formula>的大小<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M2"> <mml:mrow> <mml:mi> n</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> 米</米米l:米我> </mml:mrow> </mml:math> </inline-formula>。这个声谱图然后factorised收益率降低等级近似<gydF4y2Badisp-formula id="eq1"> <label>(1)</lgydF4y2Baabel> <mml:math altimg="C:\WINDOWS\Temp\MMLIMG24801.png" width="99" height="23" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M3"> <mml:mrow> <mml:mstyle mathvariant="bold"> <mml:mrow> <mml:mi> X</米米l:米我> </mml:mrow> </mml:mstyle> <mml:mo> ≈</米米l:米o> <mml:mover> <mml:mrow> <mml:mstyle mathvariant="bold"> <mml:mrow> <mml:mi> X</米米l:米我> </mml:mrow> </mml:mstyle> </mml:mrow> <mml:mrow> <mml:mo> ^</米米l:米o> </mml:mrow> </mml:mover> <mml:mo> =</米米l:米o> <mml:mstyle mathvariant="bold"> <mml:mrow> <mml:mi> 一个</米米l:米我> <mml:mi> 年代</米米l:米我> <mml:mo> ,</米米l:米o> </mml:mrow> </mml:mstyle> </mml:mrow> </mml:math> </disp-formula>在哪里<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M4"> <mml:mrow> <mml:mstyle mathvariant="bold"> <mml:mi> 一个</米米l:米我> </mml:mstyle> </mml:mrow> </mml:math> </inline-formula>的大小<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M5"> <mml:mrow> <mml:mi> n</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> r</米米l:米我> </mml:mrow> </mml:math> </inline-formula>和<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M6"> <mml:mrow> <mml:mstyle mathvariant="bold"> <mml:mi> 年代</米米l:米我> </mml:mstyle> </mml:mrow> </mml:math> </inline-formula>的大小<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M7"> <mml:mrow> <mml:mi> r</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> 米</米米l:米我> </mml:mrow> </mml:math> </inline-formula>,<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M8"> <mml:mrow> <mml:mi> r</米米l:米我> </mml:mrow> </mml:math> </inline-formula>不到<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M9"> <mml:mrow> <mml:mi> n</米米l:米我> </mml:mrow> </mml:math> </inline-formula>和<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M10"> <mml:mrow> <mml:mi> 米</米米l:米我> </mml:mrow> </mml:math> </inline-formula>。在这种情况下,列的<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M11"> <mml:mrow> <mml:mstyle mathvariant="bold"> <mml:mi> 一个</米米l:米我> </mml:mstyle> </mml:mrow> </mml:math> </inline-formula>包含频率基函数,而相应的行<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M12"> <mml:mrow> <mml:mstyle mathvariant="bold"> <mml:mi> 年代</米米l:米我> </mml:mstyle> </mml:mrow> </mml:math> </inline-formula>含有振幅基函数描述当频率基函数是活跃的。通常这样做是大小或功率谱图,和这种方法使得假设基函数对所产生的声音和在一起生成混合物光谱图。这并不考虑阶段的影响当色加在一起,和大小的声音(这种假设才成立如果来源不重叠在时间和频率,虽然适用平均功率谱图。各种技术的不同在这factorisation如何实现。凯西和Westner<xrgydF4y2Baef ref-type="bibr" rid="B42"> 7</xrgydF4y2Baef>)使用PCA实现降维,然后进行ICA在保留主成分来实现独立的基函数,而最近的工作都集中在使用nonnegativity约束与一个合适的成本函数(<xrgydF4y2Baef ref-type="bibr" rid="B43"> 8</xrgydF4y2Baef>,<xrgydF4y2Baef ref-type="bibr" rid="B44"> 9</xrgydF4y2Baef>]。</pgydF4y2Ba> <p>常用的成本函数是普遍Kullback-Leibler Lee Seung[提出的散度<xrgydF4y2Baef ref-type="bibr" rid="B39"> 5</xrgydF4y2Baef>]:<gydF4y2Badisp-formula id="eq2"> <label>(2)</lgydF4y2Baabel> <mml:math height="45" width="326" altimg="C:\WINDOWS\Temp\MMLIMG24811.png" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M13"> <mml:mrow> <mml:mi> D</米米l:米我> <mml:mo minsize="1em" maxsize="1em"> (</米米l:米o> <mml:mstyle mathvariant="bold"> <mml:mrow> <mml:mi> X</米米l:米我> </mml:mrow> </mml:mstyle> <mml:mo minsize="0.75em" maxsize="0.75em"> ∥</米米l:米o> <mml:mover> <mml:mrow> <mml:mstyle mathvariant="bold"> <mml:mi> X</米米l:米我> </mml:mstyle> </mml:mrow> <mml:mrow> <mml:mo> ^</米米l:米o> </mml:mrow> </mml:mover> <mml:mo minsize="1em" maxsize="1em"> )</米米l:米o> <mml:mo> =</米米l:米o> <mml:mstyle> <mml:mrow> <mml:munder> <mml:mrow> <mml:mstyle displaystyle="true"> <mml:mrow> <mml:mo> ∑</米米l:米o> </mml:mrow> </mml:mstyle> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:米我> <mml:mi> j</米米l:米我> </mml:mrow> </mml:munder> </mml:mrow> </mml:mstyle> <mml:mrow> <mml:mo minsize="1.75em" maxsize="1.75em"> (</米米l:米o> <mml:mrow> <mml:msub> <mml:mrow> <mml:mstyle mathvariant="bold"> <mml:mrow> <mml:mi> X</米米l:米我> </mml:mrow> </mml:mstyle> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:米我> <mml:mi> j</米米l:米我> </mml:mrow> </mml:msub> <mml:mi> 日志</米米l:米我> <mml:mo> ⁡</米米l:米o> <mml:mfrac> <mml:mrow> <mml:msub> <mml:mrow> <mml:mstyle mathvariant="bold"> <mml:mrow> <mml:mi> X</米米l:米我> </mml:mrow> </mml:mstyle> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:米我> <mml:mi> j</米米l:米我> </mml:mrow> </mml:msub> </mml:mrow> <mml:mrow> <mml:msub> <mml:mrow> <mml:mover> <mml:mrow> <mml:mstyle mathvariant="bold"> <mml:mrow> <mml:mi> X</米米l:米我> </mml:mrow> </mml:mstyle> </mml:mrow> <mml:mrow> <mml:mo> ^</米米l:米o> </mml:mrow> </mml:mover> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:米我> <mml:mi> j</米米l:米我> </mml:mrow> </mml:msub> </mml:mrow> </mml:mfrac> <mml:mo> −</米米l:米o> <mml:msub> <mml:mrow> <mml:mstyle mathvariant="bold"> <mml:mrow> <mml:mi> X</米米l:米我> </mml:mrow> </mml:mstyle> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:米我> <mml:mi> j</米米l:米我> </mml:mrow> </mml:msub> <mml:mo> +</米米l:米o> <mml:msub> <mml:mrow> <mml:mover> <mml:mrow> <mml:mstyle mathvariant="bold"> <mml:mrow> <mml:mi> X</米米l:米我> </mml:mrow> </mml:mstyle> </mml:mrow> <mml:mrow> <mml:mo> ^</米米l:米o> </mml:mrow> </mml:mover> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:米我> <mml:mi> j</米米l:米我> </mml:mrow> </mml:msub> </mml:mrow> <mml:mo minsize="1.75em" maxsize="1.75em"> )</米米l:米o> </mml:mrow> </mml:mrow> </mml:math> </disp-formula>相当于假设泊松噪声模型的数据(<xrgydF4y2Baef ref-type="bibr" rid="B2"> 12</xrgydF4y2Baef>]。这个成本函数已广泛应用由于其易于实现,缺少参数,和已经发现这一事实给合理的结果在许多情况下(<xrgydF4y2Baef ref-type="bibr" rid="B1"> 13</xrgydF4y2Baef>,<xrgydF4y2Baef ref-type="bibr" rid="B34"> 14</xrgydF4y2Baef>]。稀疏约束也可以被添加到这个成本函数,和乘法更新方程保证nonnegativity可以派生这些成本函数(<xrgydF4y2Baef ref-type="bibr" rid="B10"> 15</xrgydF4y2Baef>]。其他成本功能开发等factorisation音频声音的阿卜杜拉和Plumbley假定乘法gamma-distributed噪声功率谱图(<xrgydF4y2Baef ref-type="bibr" rid="B38"> 16</xrgydF4y2Baef>]。类似的成本函数最近提议由帕里和Issa试图合并阶段进入factorisation使用概率相模型(<xrgydF4y2Baef ref-type="bibr" rid="B11"> 17</xrgydF4y2Baef>,<xrgydF4y2Baef ref-type="bibr" rid="B12"> 18</xrgydF4y2Baef>]。parameterised家属提出了成本函数,如β散度(<xrgydF4y2Baef ref-type="bibr" rid="B13"> 19</xrgydF4y2Baef>],Csiszar的分歧<xrgydF4y2Baef ref-type="bibr" rid="B14"> 20.</xrgydF4y2Baef>]。使用β散度分离的语音信号研究了O’grady [<xrgydF4y2Baef ref-type="bibr" rid="B15"> 21</xrgydF4y2Baef>),他也提出了一个perceptually-based噪音面具比作为一个成本函数。</pgydF4y2Ba> <p>不管使用的成本函数,合成分解是线性的,因此每一对基函数通常对应于一个单一的注意或和弦由给定的仪器。因此,为了实现声源分离,一些方法组基函数所需的源或仪器。提出了不同的分组方法(<xrgydF4y2Baef ref-type="bibr" rid="B42"> 7</xrgydF4y2Baef>,<xrgydF4y2Baef ref-type="bibr" rid="B43"> 8</xrgydF4y2Baef>),但在实践中很难得到正确的集群中讨论的原因(<xrgydF4y2Baef ref-type="bibr" rid="B41"> 22</xrgydF4y2Baef>]。</pgydF4y2Ba> <sec sec-type="subsection" id="subsec1.1"> <title>1.1。张量符号</t我tle> <p>当处理张量符号,我们使用巴德和Kolda[描述的约定<xrgydF4y2Baef ref-type="bibr" rid="B46"> 23</xrgydF4y2Baef>]。张量表示使用书法大写字母,如<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M14"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula>。而不是使用下标表示索引的元素在一个张量或矩阵,如<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M15"> <mml:mrow> <mml:msub> <mml:mi> </米米l:米我> <mml:mrow> <mml:mi> 我</米米l:米我> <mml:mn> ,</米米l:米n> <mml:mi> j</米米l:米我> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>、索引的元素是相反的建议<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M16"> <mml:mrow> <mml:mi> </米米l:米我> <mml:mo stretchy="false"> (</米米l:米o> <mml:mi> 我</米米l:米我> <mml:mn> ,</米米l:米n> <mml:mi> j</米米l:米我> <mml:mo stretchy="false"> )</米米l:米o> </mml:mrow> </mml:math> </inline-formula>。在处理合同产品两个张量的乘法,如果<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M17"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula>是一个张量的尺寸吗<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M18"> <mml:mrow> <mml:msub> <mml:mi> 我</米米l:米我> <mml:mn> 1</米米l:米n> </mml:msub> <mml:mo> ×</米米l:米o> <mml:mo> ⋯</米米l:米o> <mml:mo> ×</米米l:米o> <mml:msub> <mml:mi> 我</米米l:米我> <mml:mi> N</米米l:米我> </mml:msub> <mml:mo> ×</米米l:米o> <mml:msub> <mml:mi> J</米米l:米我> <mml:mn> 1</米米l:米n> </mml:msub> <mml:mo> ×</米米l:米o> <mml:mo> ⋯</米米l:米o> <mml:mo> ×</米米l:米o> <mml:msub> <mml:mi> J</米米l:米我> <mml:mi> 米</米米l:米我> </mml:msub> </mml:mrow> </mml:math> </inline-formula>和<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M19"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula>是一个张量的尺寸吗<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M20"> <mml:mrow> <mml:msub> <mml:mi> 我</米米l:米我> <mml:mn> 1</米米l:米n> </mml:msub> <mml:mo> ×</米米l:米o> <mml:mo> ⋯</米米l:米o> <mml:mo> ×</米米l:米o> <mml:msub> <mml:mi> 我</米米l:米我> <mml:mi> N</米米l:米我> </mml:msub> <mml:mo> ×</米米l:米o> <mml:msub> <mml:mi> K</米米l:米我> <mml:mn> 1</米米l:米n> </mml:msub> <mml:mo> ×</米米l:米o> <mml:mo> ⋯</米米l:米o> <mml:mo> ×</米米l:米o> <mml:msub> <mml:mi> K</米米l:米我> <mml:mi> P</米米l:米我> </mml:msub> </mml:mrow> </mml:math> </inline-formula>,那么简约产品沿着第一乘法两张量<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M21"> <mml:mrow> <mml:mi> N</米米l:米我> </mml:mrow> </mml:math> </inline-formula>模式是由<gydF4y2Badisp-formula id="eq003"> <label>(3)</lgydF4y2Baabel> <mml:math altimg="C:\WINDOWS\Temp\MMLIMG24834.png" width="322" height="105" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M22"> <mml:mrow> <mml:mtable class="split" width="auto" columnalign="left"> <mml:mtr> <mml:mtd columnalign="right"></mml:mtd> <mml:mtd columnalign="left"> <mml:msub> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> 〈</米米l:米o> <mml:mi> </米米l:米我> <mml:mi> </米米l:米我> <mml:mo minsize="0.75em" maxsize="0.75em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo> :</米米l:米o> <mml:mi> N</米米l:米我> <mml:mn> ,1</米米l:米n> <mml:mo> :</米米l:米o> <mml:mi> N</米米l:米我> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> (</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> j</米米l:米我> </mml:mrow> <mml:mrow> <mml:mn> 1</米米l:米n> </mml:mrow> </mml:msub> <mml:mn> ,</米米l:米n> <mml:mo> …</米米l:米o> <mml:mn> ,</米米l:米n> <mml:msub> <mml:mrow> <mml:mi> j</米米l:米我> </mml:mrow> <mml:mrow> <mml:mi> 米</米米l:米我> </mml:mrow> </mml:msub> <mml:mn> ,</米米l:米n> <mml:msub> <mml:mrow> <mml:mi> k</米米l:米我> </mml:mrow> <mml:mrow> <mml:mn> 1</米米l:米n> </mml:mrow> </mml:msub> <mml:mn> ,</米米l:米n> <mml:mo> …</米米l:米o> <mml:mn> ,</米米l:米n> <mml:msub> <mml:mrow> <mml:mi> k</米米l:米我> </mml:mrow> <mml:mrow> <mml:mi> p</米米l:米我> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> )</米米l:米o> </mml:mtd> </mml:mtr> <mml:mtr> <mml:mtd columnalign="right"></mml:mtd> <mml:mtd columnalign="left"> <mml:mi> </mml:mi> <mml:mi> </mml:mi> <mml:mo> =</米米l:米o> <mml:mstyle> <mml:mrow> <mml:munderover> <mml:mrow> <mml:mstyle displaystyle="true"> <mml:mrow> <mml:mo> ∑</米米l:米o> </mml:mrow> </mml:mstyle> </mml:mrow> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> 我</米米l:米我> </mml:mrow> <mml:mrow> <mml:mn> 1</米米l:米n> </mml:mrow> </mml:msub> <mml:mo> =</米米l:米o> <mml:mn> 1</米米l:米n> </mml:mrow> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> 我</米米l:米我> </mml:mrow> <mml:mrow> <mml:mn> 1</米米l:米n> </mml:mrow> </mml:msub> </mml:mrow> </mml:munderover> </mml:mrow> </mml:mstyle> <mml:mo> ⋯</米米l:米o> <mml:mstyle> <mml:mrow> <mml:munderover> <mml:mrow> <mml:mstyle displaystyle="true"> <mml:mrow> <mml:mo> ∑</米米l:米o> </mml:mrow> </mml:mstyle> </mml:mrow> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> 我</米米l:米我> </mml:mrow> <mml:mrow> <mml:mi> N</米米l:米我> </mml:mrow> </mml:msub> <mml:mo> =</米米l:米o> <mml:mn> 1</米米l:米n> </mml:mrow> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> 我</米米l:米我> </mml:mrow> <mml:mrow> <mml:mi> N</米米l:米我> </mml:mrow> </mml:msub> </mml:mrow> </mml:munderover> </mml:mrow> </mml:mstyle> <mml:mi> </米米l:米我> <mml:mo minsize="1em" maxsize="1em"> (</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> 我</米米l:米我> </mml:mrow> <mml:mrow> <mml:mn> 1</米米l:米n> </mml:mrow> </mml:msub> <mml:mn> ,</米米l:米n> <mml:mo> …</米米l:米o> <mml:mn> ,</米米l:米n> <mml:msub> <mml:mrow> <mml:mi> 我</米米l:米我> </mml:mrow> <mml:mrow> <mml:mi> N</米米l:米我> </mml:mrow> </mml:msub> <mml:mn> ,</米米l:米n> <mml:msub> <mml:mrow> <mml:mi> j</米米l:米我> </mml:mrow> <mml:mrow> <mml:mn> 1</米米l:米n> </mml:mrow> </mml:msub> <mml:mn> ,</米米l:米n> <mml:mo> …</米米l:米o> <mml:mn> ,</米米l:米n> <mml:msub> <mml:mrow> <mml:mi> j</米米l:米我> </mml:mrow> <mml:mrow> <mml:mi> 米</米米l:米我> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> )</米米l:米o> </mml:mtd> </mml:mtr> <mml:mtr> <mml:mtd columnalign="right"></mml:mtd> <mml:mtd columnalign="left"> <mml:mi> </mml:mi> <mml:mi> </mml:mi> <mml:mi> </mml:mi> <mml:mi> </mml:mi> <mml:mi> </mml:mi> <mml:mi> </mml:mi> <mml:mi> </mml:mi> <mml:mi> </mml:mi> <mml:mo> ×</米米l:米o> <mml:mi> </米米l:米我> <mml:mo minsize="1em" maxsize="1em"> (</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> 我</米米l:米我> </mml:mrow> <mml:mrow> <mml:mn> 1</米米l:米n> </mml:mrow> </mml:msub> <mml:mn> ,</米米l:米n> <mml:mo> …</米米l:米o> <mml:mn> ,</米米l:米n> <mml:msub> <mml:mrow> <mml:mi> 我</米米l:米我> </mml:mrow> <mml:mrow> <mml:mi> N</米米l:米我> </mml:mrow> </mml:msub> <mml:mn> ,</米米l:米n> <mml:msub> <mml:mrow> <mml:mi> k</米米l:米我> </mml:mrow> <mml:mrow> <mml:mn> 1</米米l:米n> </mml:mrow> </mml:msub> <mml:mn> ,</米米l:米n> <mml:mo> …</米米l:米o> <mml:mn> ,</米米l:米n> <mml:msub> <mml:mrow> <mml:mi> k</米米l:米我> </mml:mrow> <mml:mrow> <mml:mi> P</米米l:米我> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> )</米米l:米o> <mml:mo> ,</米米l:米o> </mml:mtd> </mml:mtr> </mml:mtable> </mml:mrow> </mml:math> </disp-formula>增加指定的模式在尖括号中包含的下标。</pgydF4y2Ba> <p>Elementwise乘法和除法的表示<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M23"> <mml:mrow> <mml:mo> ⊗</米米l:米o> </mml:mrow> </mml:math> </inline-formula>和<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M24"> <mml:mrow> <mml:mo> ⊘</米米l:米o> <mml:mn> ,</米米l:米n> </mml:mrow> </mml:math> </inline-formula>分别用乘法和外部产品<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M25"> <mml:mrow> <mml:mo> ∘</米米l:米o> </mml:mrow> </mml:math> </inline-formula>。此外,为简单起见符号,除非另有说明,否则我们使用约定<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M26"> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:math> </inline-formula>表示相关的张片<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M27"> <mml:mrow> <mml:mi> k</米米l:米我> </mml:mrow> </mml:math> </inline-formula>th源,单维度包含在片的大小。</pgydF4y2Ba> </sec> <sec sec-type="subsection" id="subsec1.2"> <title>1.2。张量Factorisation</t我tle> <p>最近,上述矩阵factorisation技术已经扩展到张量factorisation模型来处理由菲茨杰拉德立体声或多通道信号等等。(<xrgydF4y2Baef ref-type="bibr" rid="B35"> 24</xrgydF4y2Baef>和帕里和艾萨<xrgydF4y2Baef ref-type="bibr" rid="B16"> 25</xrgydF4y2Baef>]。信号模型可以表示为<gydF4y2Badisp-formula id="eq3"> <label>(4)</lgydF4y2Baabel> <mml:math altimg="C:\WINDOWS\Temp\MMLIMG24864.png" width="224" height="31" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M28"> <mml:mrow> <mml:mi> </米米l:米我> <mml:mo> ≈</米米l:米o> <mml:mover accent="true"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> ^</米米l:米o> </mml:mrow> </mml:mover> <mml:mo> =</米米l:米o> <mml:mstyle> <mml:mrow> <mml:munderover> <mml:mstyle displaystyle="true"> <mml:mrow> <mml:mo> ∑</米米l:米o> </mml:mrow> </mml:mstyle> <mml:mrow> <mml:mi> b</米米l:米我> <mml:mo> =</米米l:米o> <mml:mn> 1</米米l:米n> </mml:mrow> <mml:mrow> <mml:mi> B</米米l:米我> </mml:mrow> </mml:munderover> </mml:mrow> </mml:mstyle> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> b</米米l:米我> </mml:mrow> </mml:msub> <mml:mo> ∘</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> b</米米l:米我> </mml:mrow> </mml:msub> <mml:mo> ∘</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> b</米米l:米我> </mml:mrow> </mml:msub> <mml:mn> ,</米米l:米n> </mml:mrow> </mml:math> </disp-formula>在哪里<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M29"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula>是一个<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M30"> <mml:mrow> <mml:mi> r</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> n</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> 米</米米l:米我> </mml:mrow> </mml:math> </inline-formula>张量包含的谱图<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M31"> <mml:mrow> <mml:mi> r</米米l:米我> </mml:mrow> </mml:math> </inline-formula>渠道,<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M32"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula>是一个<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M33"> <mml:mrow> <mml:mi> r</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> B</米米l:米我> </mml:mrow> </mml:math> </inline-formula>包含的收益矩阵<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M34"> <mml:mrow> <mml:mi> B</米米l:米我> </mml:mrow> </mml:math> </inline-formula>基函数在每个通道,<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M35"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula>是一个矩阵的大小<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M36"> <mml:mrow> <mml:mi> n</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> B</米米l:米我> </mml:mrow> </mml:math> </inline-formula>包含一组频率基函数和<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M37"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula>是一个矩阵的大小<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M38"> <mml:mrow> <mml:mi> 米</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> B</米米l:米我> </mml:mrow> </mml:math> </inline-formula>包含振幅基函数。在这种情况下,<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M39"> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> b</米米l:米我> </mml:mrow> </mml:math> </inline-formula>是用来表示<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M40"> <mml:mrow> <mml:mi> b</米米l:米我> </mml:mrow> </mml:math> </inline-formula>一个给定的矩阵的列。</pgydF4y2Ba> <p>作为第一近似,许多商业立体声录音可以认为是由每个仪器分别获得单通道的录音,然后求和和分发这些录音在两个渠道,因此对于任何给定的仪器,这两个渠道的唯一区别在于获得的仪器<xrgydF4y2Baef ref-type="bibr" rid="B50"> 26</xrgydF4y2Baef>]。张factorisation模型提供了一个很好的近似。扩展张量factorisation还提供了另一个的信息来源,可用于集群的基础功能,即基函数属于同一来源的应该也有类似的收益。然而,随着基函数数量的增加变得越来越难获得良好的集群使用这些信息,当基函数之间共享资源。</pgydF4y2Ba> </sec> </sec> <sec sec-type="section" id="sec2"> <title>2。移不变的Factorisation算法</t我tle> <p>将移不变性的概念factorisation算法介绍了声源分离的convolutive factorisation Smaragdis提出的算法(<xrgydF4y2Baef ref-type="bibr" rid="B18"> 27</xrgydF4y2Baef>]和[维尔塔宁<xrgydF4y2Baef ref-type="bibr" rid="B17"> 28</xrgydF4y2Baef>]。这样做是为了解决一个特定的标准factorisation技术的缺点,即单一频率基函数无法成功捕捉声音的频率内容的发展随着时间的推移,如口语话语和鼓的声音。为了克服这个限制,振幅基函数被允许转移时间,捕捉不同的频率基函数与每个转变。这些频率基函数结合时,结果是一个给定源的光谱图,抓住了声源的频率的演化特征。</pgydF4y2Ba> <p>移不变性在频基函数后来开发的克服问题的分组频率基函数的来源,特别是在情况发生不同的笔记由相同的仪器的光谱图(<xrgydF4y2Baef ref-type="bibr" rid="B34"> 14</xrgydF4y2Baef>,<xrgydF4y2Baef ref-type="bibr" rid="B7"> 29日</xrgydF4y2Baef>]。解决了这个缺点,文森特和Rodet使用非线性ISA方法(<xrgydF4y2Baef ref-type="bibr" rid="B45"> 30.</xrgydF4y2Baef>),但这种技术之前需要pretraining源先验分离。</pgydF4y2Ba> <p>合并时移不变性在频基函数,假定所有笔记由一个搭仪器由单一频率基函数的翻译版本。这一仪器基函数被认为代表了典型的频率特性的仪器。这是一个简化的实际情况,在实践中,给定的乐器的音色改变音高(<xrgydF4y2Baef ref-type="bibr" rid="B8"> 31日</xrgydF4y2Baef>]。尽管如此,假设确实代表一个有效的近似音高范围有限,这个假设被用于许多商业音乐采样和合成器,在预录好的一注意给定的音高是用于生成其他笔记在球场上接近原来的注意。使用移不变性的主要优势在频基函数,而不是基函数必须分组之前各自的来源可能发生分离,就像在标准NMF、频移不变的模型允许个人工具或来源模仿明确每个源有一个张量的估计。</pgydF4y2Ba> <p>到目前为止,移不变性的公司所需的频率基函数的使用对数频率分辨率的谱图,如常数<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M41"> <mml:mrow> <mml:mi> 问</米米l:米我> </mml:mrow> </mml:math> </inline-formula>变换(CQT) [<xrgydF4y2Baef ref-type="bibr" rid="B33"> 32</xrgydF4y2Baef>]。另外,对数频率变换可以用加权求和的近似线性频率谱图垃圾箱,比如从短时傅里叶变换获得。这可以表示为<gydF4y2Badisp-formula id="eq4"> <label>(5)</lgydF4y2Baabel> <mml:math altimg="C:\WINDOWS\Temp\MMLIMG24898.png" width="72" height="17" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M42"> <mml:mrow> <mml:mstyle mathvariant="bold"> <mml:mi> X</米米l:米我> </mml:mstyle> <mml:mo> =</米米l:米o> <mml:mstyle mathvariant="bold"> <mml:mi> R</米米l:米我> <mml:mi> Y</米米l:米我> <mml:mo> ,</米米l:米o> </mml:mstyle> </mml:mrow> </mml:math> </disp-formula>在哪里<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M43"> <mml:mrow> <mml:mstyle mathvariant="bold"> <mml:mi> Y</米米l:米我> </mml:mstyle> </mml:mrow> </mml:math> </inline-formula>是一个线性频率谱图<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M44"> <mml:mrow> <mml:mi> f</米米l:米我> </mml:mrow> </mml:math> </inline-formula>频率和<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M45"> <mml:mrow> <mml:mi> t</米米l:米我> </mml:mrow> </mml:math> </inline-formula>时间框架。<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M46"> <mml:mrow> <mml:mstyle mathvariant="bold"> <mml:mi> R</米米l:米我> </mml:mstyle> </mml:mrow> </mml:math> </inline-formula>是一个频率加权矩阵的大小<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M47"> <mml:mrow> <mml:mi> c</米米l:米我> <mml:mi> f</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> f</米米l:米我> </mml:mrow> </mml:math> </inline-formula>这地图<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M48"> <mml:mrow> <mml:mi> f</米米l:米我> </mml:mrow> </mml:math> </inline-formula>线性频率垃圾箱,<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M49"> <mml:mrow> <mml:mi> c</米米l:米我> <mml:mi> f</米米l:米我> </mml:mrow> </mml:math> </inline-formula>对数频率垃圾箱,<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M50"> <mml:mrow> <mml:mi> c</米米l:米我> <mml:mi> f</米米l:米我> <mml:mo> <</米米l:米o> <mml:mi> f</米米l:米我> </mml:mrow> </mml:math> </inline-formula>和<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M51"> <mml:mrow> <mml:mstyle mathvariant="bold"> <mml:mi> X</米米l:米我> </mml:mstyle> </mml:mrow> </mml:math> </inline-formula>是一个对数频率谱图的尺寸吗<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M52"> <mml:mrow> <mml:mi> c</米米l:米我> <mml:mi> f</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> t</米米l:米我> </mml:mrow> </mml:math> </inline-formula>。可以看出<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M53"> <mml:mrow> <mml:mstyle mathvariant="bold"> <mml:mi> R</米米l:米我> </mml:mstyle> </mml:mrow> </mml:math> </inline-formula>是一个长方形矩阵不存在真正的逆,使任何映射从对数频率分辨率线性频率分辨率只有一个近似映射。</pgydF4y2Ba> <p>如果对数频率变换的频率分辨率设置,以便提高乐队的中心频率<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M54"> <mml:mrow> <mml:msub> <mml:mi> f</米米l:米我> <mml:mi> x</米米l:米我> </mml:msub> <mml:mo> =</米米l:米o> <mml:msub> <mml:mi> f</米米l:米我> <mml:mn> 0</米米l:米n> </mml:msub> <mml:msup> <mml:mi> β</米米l:米我> <mml:mrow> <mml:mi> x</米米l:米我> <mml:mo> −</米米l:米o> <mml:mn> 1</米米l:米n> </mml:mrow> </mml:msup> <mml:mn> ,</米米l:米n> </mml:mrow> </mml:math> </inline-formula>在哪里<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M55"> <mml:mrow> <mml:msub> <mml:mi> f</米米l:米我> <mml:mi> x</米米l:米我> </mml:msub> </mml:mrow> </mml:math> </inline-formula>表示的中心频率<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M56"> <mml:mrow> <mml:mi> x</米米l:米我> </mml:mrow> </mml:math> </inline-formula>th乐队,<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M57"> <mml:mrow> <mml:mi> β</米米l:米我> <mml:msup> <mml:mrow> <mml:mo> =</米米l:米o> <mml:mn> 2</米米l:米n> </mml:mrow> <mml:mrow> <mml:mn> 1</米米l:米n> <mml:mo> /</米米l:米o> <mml:mn> 12</米米l:米n> </mml:mrow> </mml:msup> <mml:mn> ,</米米l:米n> </mml:mrow> </mml:math> </inline-formula>和<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M58"> <mml:mrow> <mml:msub> <mml:mi> f</米米l:米我> <mml:mn> 0</米米l:米n> </mml:msub> </mml:mrow> </mml:math> </inline-formula>是一个参考频率,然后乐队将匹配的间距等音阶的规模在西方音乐中使用。向上或向下转移,本将对应于一个半音程的音调变化。</pgydF4y2Ba> <p>在本文的上下文中,翻译的基函数是通过翻译进行张量,虽然其他剂型,如转移算子Smaragdis提出的方法(<xrgydF4y2Baef ref-type="bibr" rid="B18"> 27</xrgydF4y2Baef>可以使用)。将一个<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M59"> <mml:mrow> <mml:mi> n</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mn> 1</米米l:米n> </mml:mrow> </mml:math> </inline-formula>向量,一个<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M60"> <mml:mrow> <mml:mi> n</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> n</米米l:米我> </mml:mrow> </mml:math> </inline-formula>翻译矩阵是必需的。这可以由交换单位矩阵的列。例如,在将一个基函数的情况下,翻译矩阵可以得到<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M61"> <mml:mrow> <mml:mstyle mathvariant="bold"> <mml:mi> 我</米米l:米我> </mml:mstyle> <mml:mrow> <mml:mo stretchy="false"> (</米米l:米o> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mo> ,</米米l:米o> <mml:mrow> <mml:mo stretchy="false"> (</米米l:米o> <mml:mrow> <mml:mi> n</米米l:米我> <mml:mn> ,1</米米l:米n> <mml:mo> :</米米l:米o> <mml:mi> n</米米l:米我> <mml:mo> −</米米l:米o> <mml:mn> 1</米米l:米n> </mml:mrow> <mml:mo stretchy="false"> ]</米米l:米o> </mml:mrow> </mml:mrow> <mml:mo stretchy="false"> )</米米l:米o> </mml:mrow> </mml:mrow> </mml:math> </inline-formula>,单位矩阵用<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M62"> <mml:mrow> <mml:mstyle mathvariant="bold"> <mml:mi> 我</米米l:米我> </mml:mstyle> </mml:mrow> </mml:math> </inline-formula>和的顺序列包含在方括号中<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M63"> <mml:mrow> <mml:mrow> <mml:mo stretchy="false"> (</米米l:米o> <mml:mrow> <mml:mi> n</米米l:米我> <mml:mn> ,1</米米l:米n> <mml:mo> :</米米l:米o> <mml:mi> n</米米l:米我> <mml:mo> −</米米l:米o> <mml:mn> 1</米米l:米n> </mml:mrow> <mml:mo stretchy="false"> ]</米米l:米o> </mml:mrow> </mml:mrow> </mml:math> </inline-formula>表明<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M64"> <mml:mrow> <mml:mi> n</米米l:米我> </mml:mrow> </mml:math> </inline-formula>第一个元素的排列,紧随其后的是条目的<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M65"> <mml:mrow> <mml:mn> 1</米米l:米n> <mml:mo> :</米米l:米o> <mml:mi> n</米米l:米我> <mml:mo> −</米米l:米o> <mml:mn> 1</米米l:米n> </mml:mrow> </mml:math> </inline-formula>。为<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M66"> <mml:mrow> <mml:mi> Z</米米l:米我> </mml:mrow> </mml:math> </inline-formula>允许的翻译,这些翻译矩阵分为翻译张量的大小<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M67"> <mml:mrow> <mml:mi> n</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> Z</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> n</米米l:米我> </mml:mrow> </mml:math> </inline-formula>。</pgydF4y2Ba> <p>研究还对允许更一般形式的不变性,如艾格特等等。在变换不变的NMF [<xrgydF4y2Baef ref-type="bibr" rid="B9"> 33</xrgydF4y2Baef>),所有形式的平移和旋转等变换处理的变换矩阵。然而,他们的模型只有在证明翻译或者移不变性。进一步,而变换矩阵可以被用来允许使用线性频率分辨率通过使用一个矩阵,,已经注意到其他地方,这种拉伸很难执行使用离散线性频率表示[<xrgydF4y2Baef ref-type="bibr" rid="B1"> 13</xrgydF4y2Baef>]。</pgydF4y2Ba> <sec sec-type="subsection" id="subsec2.1"> <title>2.1。二维非负张量Factorisation转移</t我tle> <p>所有的算法将移不变性可以看作是特殊情况的更一般的模型,将二维非负张量factorisation (SNTF)提出的菲茨杰拉德(<xrgydF4y2Baef ref-type="bibr" rid="B37"> 34</xrgydF4y2Baef>由[],分别<xrgydF4y2Baef ref-type="bibr" rid="B19"> 35</xrgydF4y2Baef>]。SNTF模型可以描述为<gydF4y2Badisp-formula id="eq5"> <label>(6)</lgydF4y2Baabel> <mml:math altimg="C:\WINDOWS\Temp\MMLIMG24924.png" width="379" height="31" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M68"> <mml:mrow> <mml:mi> </米米l:米我> <mml:mo> ≈</米米l:米o> <mml:mstyle> <mml:mrow> <mml:munderover> <mml:mrow> <mml:mstyle displaystyle="true"> <mml:mrow> <mml:mo> ∑</米米l:米o> </mml:mrow> </mml:mstyle> </mml:mrow> <mml:mrow> <mml:mi> k</米米l:米我> <mml:mo> =</米米l:米o> <mml:mn> 1</米米l:米n> </mml:mrow> <mml:mrow> <mml:mi> K</米米l:米我> </mml:mrow> </mml:munderover> </mml:mrow> </mml:mstyle> <mml:msub> <mml:mrow> <mml:mo minsize="1.5em" maxsize="1.5em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mo minsize="1.25em" maxsize="1.25em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:mi> </米米l:米我> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mi> </米米l:米我> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mo minsize="1.25em" maxsize="1.25em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 4</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mo minsize="1.5em" maxsize="1.5em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mn> ,</米米l:米n> </mml:mrow> </mml:math> </disp-formula>在哪里<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M69"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula>是一个张量的尺寸吗<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M70"> <mml:mrow> <mml:mi> r</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> n</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> 米</米米l:米我> </mml:mrow> </mml:math> </inline-formula>,包含每个通道的信号的幅度谱图。<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M71"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula>是一个张量的尺寸吗<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M72"> <mml:mrow> <mml:mi> r</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> K</米米l:米我> </mml:mrow> </mml:math> </inline-formula>,包含每个的的收益<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M73"> <mml:mrow> <mml:mi> K</米米l:米我> </mml:mrow> </mml:math> </inline-formula>在每一个来源<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M74"> <mml:mrow> <mml:mi> r</米米l:米我> </mml:mrow> </mml:math> </inline-formula>频道。<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M75"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula>是一个<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M76"> <mml:mrow> <mml:mi> n</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> z</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> n</米米l:米我> </mml:mrow> </mml:math> </inline-formula>翻译张量,这意味着仪器基函数<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M77"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula>在频率上升或下降,<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M78"> <mml:mrow> <mml:mi> z</米米l:米我> </mml:mrow> </mml:math> </inline-formula>是翻译的数量的频率,从而逼近给定源所扮演的不同的音符。<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M79"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula>是一个张量的尺寸吗<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M80"> <mml:mrow> <mml:mi> n</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> K</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> p</米米l:米我> </mml:mrow> </mml:math> </inline-formula>,在那里<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M81"> <mml:mrow> <mml:mi> p</米米l:米我> </mml:mrow> </mml:math> </inline-formula>是翻译的数量在时间。<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M82"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula>是一个张量的尺寸吗<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M83"> <mml:mrow> <mml:mi> z</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> K</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> 米</米米l:米我> </mml:mrow> </mml:math> </inline-formula>包含激活的翻译<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M84"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula>表明当给定注意由给定的仪器出现,从而生成一个转录的信号。<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M85"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula>是一个<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M86"> <mml:mrow> <mml:mi> 米</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> p</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> 米</米米l:米我> </mml:mrow> </mml:math> </inline-formula>翻译张量翻译中包含的时间激活功能<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M87"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula>跨越时间,从而使时变源或仪器光谱。这些张量,其尺寸和函数列于表<xrgydF4y2Baef ref-type="table" rid="tab1"> 1</xrgydF4y2Baef>为了便于参考,在后续使用的所有张量模型。如果通道的数量设置为<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M88"> <mml:mrow> <mml:mi> r</米米l:米我> <mml:mo> =</米米l:米o> <mml:mn> 1</米米l:米n> </mml:mrow> </mml:math> </inline-formula>,允许频率翻译<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M89"> <mml:mrow> <mml:mi> z</米米l:米我> </mml:mrow> </mml:math> </inline-formula>也设置为1,那么这个模型提出的崩溃,维尔塔宁(<xrgydF4y2Baef ref-type="bibr" rid="B17"> 28</xrgydF4y2Baef>]。同样,设置<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M90"> <mml:mrow> <mml:mi> p</米米l:米我> <mml:mo> =</米米l:米o> <mml:mn> 1</米米l:米n> </mml:mrow> </mml:math> </inline-formula>结果在模型中提出了(<xrgydF4y2Baef ref-type="bibr" rid="B36"> 36</xrgydF4y2Baef>),而设置<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M91"> <mml:mrow> <mml:mi> r</米米l:米我> </mml:mrow> </mml:math> </inline-formula>和<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M92"> <mml:mrow> <mml:mi> p</米米l:米我> </mml:mrow> </mml:math> </inline-formula>在模型中描述(一个结果<xrgydF4y2Baef ref-type="disp-formula" rid="eq3"> 4</xrgydF4y2Baef>)。在[<xrgydF4y2Baef ref-type="bibr" rid="B37"> 34</xrgydF4y2Baef>],普遍Kullback-Leibler散度作为一个成本函数,和乘法更新方程推导<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M93"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula>,<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M94"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula>,<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M95"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula>。</pgydF4y2Ba> <table-wrap id="tab1"> <label>表1</lgydF4y2Baabel> <p>总结使用张量,尺寸,功能,各种移不变的factorisation模型包含在本文中。张量发生在多个模型不重复。</pgydF4y2Ba> <table> <tbody> <tr> <td align="left" rowspan="7">SNTF</tgydF4y2Bad> <td align="center"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M96"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula></td> <td align="left"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M97"> <mml:mrow> <mml:mi> r</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> n</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> 米</米米l:米我> </mml:mrow> </mml:math> </inline-formula></td> <td align="left">信号谱图</tgydF4y2Bad> </tr> <tr> <td align="center"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M98"> <mml:mrow> <mml:mover accent="true"> <mml:mi> </米米l:米我> <mml:mo> ^</米米l:米o> </mml:mover> </mml:mrow> </mml:math> </inline-formula></td> <td align="left"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M99"> <mml:mrow> <mml:mi> r</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> n</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> 米</米米l:米我> </mml:mrow> </mml:math> </inline-formula></td> <td align="left">近似的<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M100"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula></td> </tr> <tr> <td align="center"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M101"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula></td> <td align="left"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M102"> <mml:mrow> <mml:mi> r</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> K</米米l:米我> </mml:mrow> </mml:math> </inline-formula></td> <td align="left">仪器收益</tgydF4y2Bad> </tr> <tr> <td align="center"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M103"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula></td> <td align="left"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M104"> <mml:mrow> <mml:mi> n</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> z</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> n</米米l:米我> </mml:mrow> </mml:math> </inline-formula></td> <td align="left">翻译张量(频率)。</tgydF4y2Bad> </tr> <tr> <td align="center"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M105"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula></td> <td align="left"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M106"> <mml:mrow> <mml:mi> n</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> K</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> p</米米l:米我> </mml:mrow> </mml:math> </inline-formula></td> <td align="left">仪器基函数</tgydF4y2Bad> </tr> <tr> <td align="center"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M107"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula></td> <td align="left"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M108"> <mml:mrow> <mml:mi> z</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> K</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> 米</米米l:米我> </mml:mrow> </mml:math> </inline-formula></td> <td align="left">注意激活</tgydF4y2Bad> </tr> <tr> <td align="center"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M109"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula></td> <td align="left"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M110"> <mml:mrow> <mml:mi> 米</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> p</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> 米</米米l:米我> </mml:mrow> </mml:math> </inline-formula></td> <td align="left">翻译张量(时间)</tgydF4y2Bad> </tr> <tr> <td align="center" colspan="4"> <hr></td> </tr> <tr> <td align="left" rowspan="2">SSNTF</tgydF4y2Bad> <td align="center"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M111"> <mml:mrow> <mml:mi> ℋ</米米l:米我> </mml:mrow> </mml:math> </inline-formula></td> <td align="left"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M112"> <mml:mrow> <mml:mi> n</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> z</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> h</米米l:米我> </mml:mrow> </mml:math> </inline-formula></td> <td align="left">谐波的字典</tgydF4y2Bad> </tr> <tr> <td align="center"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M113"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula></td> <td align="left"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M114"> <mml:mrow> <mml:mi> h</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> K</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> p</米米l:米我> </mml:mrow> </mml:math> </inline-formula></td> <td align="left">谐波的重量</tgydF4y2Bad> </tr> <tr> <td align="center" colspan="4"> <hr></td> </tr> <tr> <td align="left">SF-SSNTF</tgydF4y2Bad> <td align="center"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M115"> <mml:mrow> <mml:mi> ℱ</米米l:米我> </mml:mrow> </mml:math> </inline-formula></td> <td align="left"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M116"> <mml:mrow> <mml:mi> n</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> K</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> n</米米l:米我> </mml:mrow> </mml:math> </inline-formula></td> <td align="left">共振峰的过滤器</tgydF4y2Bad> </tr> <tr> <td align="center" colspan="4"> <hr></td> </tr> <tr> <td align="left" rowspan="4">SF-SSNTF + N</tgydF4y2Bad> <td align="center"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M117"> <mml:mrow> <mml:mi> ℳ</米米l:米我> </mml:mrow> </mml:math> </inline-formula></td> <td align="left"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M118"> <mml:mrow> <mml:mi> r</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> l</米米l:米我> </mml:mrow> </mml:math> </inline-formula></td> <td align="left">噪音乐器收益</tgydF4y2Bad> </tr> <tr> <td align="center"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M119"> <mml:mrow> <mml:mi> ℬ</米米l:米我> </mml:mrow> </mml:math> </inline-formula></td> <td align="left"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M120"> <mml:mrow> <mml:mi> n</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> l</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> 问</米米l:米我> </mml:mrow> </mml:math> </inline-formula></td> <td align="left">噪声的基函数</tgydF4y2Bad> </tr> <tr> <td align="center"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M121"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula></td> <td align="left"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M122"> <mml:mrow> <mml:mi> l</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> 米</米米l:米我> </mml:mrow> </mml:math> </inline-formula></td> <td align="left">噪音激活</tgydF4y2Bad> </tr> <tr> <td align="center"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M123"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula></td> <td align="left"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M124"> <mml:mrow> <mml:mi> 米</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> 问</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> 米</米米l:米我> </mml:mrow> </mml:math> </inline-formula></td> <td align="left">噪音翻译张量</tgydF4y2Bad> </tr> </tbody> </table> </table-wrap> <p>使用SNTF时,给定定位仪器是仪器光谱图建模的翻译上下的频率给不同的音符演奏的乐器。然后使用增益参数位置的仪器在音响领域正确的位置。的谱图<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M125"> <mml:mrow> <mml:mi> k</米米l:米我> </mml:mrow> </mml:math> </inline-formula>th分离源可以估计(<xrgydF4y2Baef ref-type="disp-formula" rid="eq5"> 6</xrgydF4y2Baef>)仅使用相关的张片<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M126"> <mml:mrow> <mml:mi> k</米米l:米我> </mml:mrow> </mml:math> </inline-formula>源。这种光谱图可以倒时域波形通过重用原始混合信号的相位信息,或通过生成一组相位信息使用Slaney[提出的技术<xrgydF4y2Baef ref-type="bibr" rid="B24"> 37</xrgydF4y2Baef>]。或者,恢复光谱图可以用来生成一个Wiener-type滤波器可以应用到原始复杂的短时傅里叶变换。</pgydF4y2Ba> <p>如前所述,从对数频率线性频域的映射是一个近似的映射,这可以在声音质量有不利影响的再合成。各种方法来执行这种映射和获得一个逆CQT调查(<xrgydF4y2Baef ref-type="bibr" rid="B21"> 38</xrgydF4y2Baef>,<xrgydF4y2Baef ref-type="bibr" rid="B23"> 39</xrgydF4y2Baef>]。然而,一个更简单的克服这个问题的方法是将映射到模型中。这可以通过替换<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M127"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula>在(<xrgydF4y2Baef ref-type="disp-formula" rid="eq5"> 6</xrgydF4y2Baef>),<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M128"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mo stretchy="false"> 〈</米米l:米o> <mml:mi> ℛ</米米l:米我> <mml:mi> </米米l:米我> <mml:mo stretchy="false"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo stretchy="false"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo stretchy="false"> }</米米l:米o> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>,在那里<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M129"> <mml:mrow> <mml:mi> ℛ</米米l:米我> </mml:mrow> </mml:math> </inline-formula>是一个近似从对数线性映射领域。这种映射可以简单的转置<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M130"> <mml:mrow> <mml:mstyle mathvariant="bold"> <mml:mi> R</米米l:米我> </mml:mstyle> </mml:mrow> </mml:math> </inline-formula>中使用的映射(<xrgydF4y2Baef ref-type="disp-formula" rid="eq4"> 5</xrgydF4y2Baef>)。移不变性仍在对数频率域实现,但现在成本函数在线性频域测量。这类似于O’grady提出的方法在使用noise-to-mask比作为一个成本函数(<xrgydF4y2Baef ref-type="bibr" rid="B15"> 21</xrgydF4y2Baef>]。O ' grady包括从线性映射到树皮域算法中,随着成本函数需要用树皮尺度域。指出,这导致了能源在幅度谱图领域蔓延。修改SNTF算法,应用相反的情况,我们希望测量的成本函数线性光谱图域级,而不是一个对数频率域,和更少的能量映射结果的整合传播频率基函数的常数<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M131"> <mml:mrow> <mml:mi> 问</米米l:米我> </mml:mrow> </mml:math> </inline-formula>域。它还执行优化领域的优势,最后对时间域将反转。尽管如此,一个近似映射的使用仍有不利影响的再合成质量。</pgydF4y2Ba> <p>为了克服这些问题再合成,施密特等等。提出使用色恢复到创建面具,然后用来refilter原始光谱图(<xrgydF4y2Baef ref-type="bibr" rid="B20"> 40</xrgydF4y2Baef>]。施密特等等。使用二进制屏蔽方法,箱子被分配给最高权力的来源,本。在本文中,我们使用一个refiltering方法恢复源谱图在哪里乘原混合物光谱图发现这给更好的结果比先前所描述的方法。</pgydF4y2Ba> </sec> </sec> <sec sec-type="section" id="sec3"> <title>3所示。正弦转二维非负张量Factorisation</t我tle> <p>虽然SNTF已被证明是能够分离混合物的谐波定位仪器(<xrgydF4y2Baef ref-type="bibr" rid="B37"> 34</xrgydF4y2Baef>方法],一个潜在的问题是没有保证将谐波基函数。谐波的一种约束,即基函数在区域只允许有非零值对应于一个完美的谐波,提出了由维尔塔宁(<xrgydF4y2Baef ref-type="bibr" rid="B1"> 13</xrgydF4y2Baef>),后来由康特等等。(<xrgydF4y2Baef ref-type="bibr" rid="B25"> 11</xrgydF4y2Baef>),它用于multipitch估计的目的。然而,这种技术,并不能保证返回值谐波地区的基函数对应于实际形状,一个正弦信号如果存在。它也由康特指出,当使用这个返回的结构约束可能并不总是被纯粹的谐波峰值有可能发生在点不调和的中心地区。</pgydF4y2Ba> <p>问题的另一种方法对基函数是调和性约束注意窗口的正弦信号的幅度谱可以直接计算出在封闭的转移和扩展版本窗口的频率响应<xrgydF4y2Baef ref-type="bibr" rid="B27"> 41</xrgydF4y2Baef>]。例如,使用一个损害窗口,正弦信号的幅度谱的频率<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M132"> <mml:mrow> <mml:msub> <mml:mi> f</米米l:米我> <mml:mn> 0</米米l:米n> </mml:msub> <mml:mo> =</米米l:米o> <mml:mi> h</米米l:米我> <mml:mn> 2</米米l:米n> <mml:mi> π</米米l:米我> <mml:mo> /</米米l:米o> <mml:msub> <mml:mi> f</米米l:米我> <mml:mi> 年代</米米l:米我> </mml:msub> </mml:mrow> </mml:math> </inline-formula>,在那里<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M133"> <mml:mrow> <mml:mi> h</米米l:米我> </mml:mrow> </mml:math> </inline-formula>在赫兹的频率,<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M134"> <mml:mrow> <mml:msub> <mml:mi> f</米米l:米我> <mml:mi> 年代</米米l:米我> </mml:msub> </mml:mrow> </mml:math> </inline-formula>赫兹的采样频率,<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M135"> <mml:mrow> <mml:mi> N</米米l:米我> </mml:mrow> </mml:math> </inline-formula>是所需的FFT,是吗<gydF4y2Badisp-formula id="eq6"> <label>(7)</lgydF4y2Baabel> <mml:math altimg="C:\WINDOWS\Temp\MMLIMG25056.png" width="338" height="22" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M136"> <mml:mrow> <mml:mi> X</米米l:米我> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mi> x</米米l:米我> <mml:mo minsize="0.75em" maxsize="0.75em"> )</米米l:米o> </mml:mrow> <mml:mo> =</米米l:米o> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> |</米米l:米o> <mml:mrow> <mml:mn> 0.5</米米l:米n> <mml:mi> D</米米l:米我> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mi> g</米米l:米我> <mml:mo minsize="0.75em" maxsize="0.75em"> )</米米l:米o> </mml:mrow> <mml:mo> +</米米l:米o> <mml:mn> 0.25</米米l:米n> <mml:mo minsize="1em" maxsize="1em"> {</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> D</米米l:米我> </mml:mrow> <mml:mrow> <mml:mn> 1</米米l:米n> </mml:mrow> </mml:msub> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mi> g</米米l:米我> <mml:mo minsize="0.75em" maxsize="0.75em"> )</米米l:米o> </mml:mrow> <mml:mo> +</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> D</米米l:米我> </mml:mrow> <mml:mrow> <mml:mn> 2</米米l:米n> </mml:mrow> </mml:msub> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mi> g</米米l:米我> <mml:mo minsize="0.75em" maxsize="0.75em"> )</米米l:米o> </mml:mrow> <mml:mo minsize="1em" maxsize="1em"> }</米米l:米o> </mml:mrow> <mml:mo minsize="1em" maxsize="1em"> |</米米l:米o> </mml:mrow> <mml:mn> ,</米米l:米n> </mml:mrow> </mml:math> </disp-formula>在哪里<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M137"> <mml:mrow> <mml:mi> g</米米l:米我> <mml:mo> =</米米l:米o> <mml:msub> <mml:mi> f</米米l:米我> <mml:mi> x</米米l:米我> </mml:msub> <mml:mo> −</米米l:米o> <mml:msub> <mml:mi> f</米米l:米我> <mml:mn> 0</米米l:米n> </mml:msub> <mml:mn> ,</米米l:米n> </mml:mrow> </mml:math> </inline-formula>与<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M138"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> f</米米l:米我> </mml:mrow> <mml:mrow> <mml:mi> x</米米l:米我> </mml:mrow> </mml:msub> <mml:mo> =</米米l:米o> <mml:mi> x</米米l:米我> <mml:mn> 2</米米l:米n> <mml:mi> π</米米l:米我> <mml:mo> /</米米l:米o> <mml:mi> N</米米l:米我> </mml:mrow> </mml:math> </inline-formula>的中心频率<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M139"> <mml:mrow> <mml:mi> x</米米l:米我> </mml:mrow> </mml:math> </inline-formula>th FFT本,<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M140"> <mml:mrow> <mml:mi> D</米米l:米我> </mml:mrow> </mml:math> </inline-formula>被定义为<gydF4y2Badisp-formula id="eq7"> <label>(8)</lgydF4y2Baabel> <mml:math altimg="C:\WINDOWS\Temp\MMLIMG25061.png" width="135" height="30" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M141"> <mml:mrow> <mml:mi> D</米米l:米我> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mi> g</米米l:米我> <mml:mo minsize="0.75em" maxsize="0.75em"> )</米米l:米o> </mml:mrow> <mml:mo> =</米米l:米o> <mml:mfrac> <mml:mrow> <mml:mi> 罪</米米l:米我> <mml:mo> ⁡</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mi> g</米米l:米我> <mml:mi> N</米米l:米我> <mml:mo> /</米米l:米o> <mml:mn> 2</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> )</米米l:米o> </mml:mrow> </mml:mrow> <mml:mrow> <mml:mi> 罪</米米l:米我> <mml:mo> ⁡</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mi> g</米米l:米我> <mml:mo> /</米米l:米o> <mml:mn> 2</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> )</米米l:米o> </mml:mrow> </mml:mrow> </mml:mfrac> <mml:mn> ,</米米l:米n> </mml:mrow> </mml:math> </disp-formula>与<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M142"> <mml:mrow> <mml:msub> <mml:mi> D</米米l:米我> <mml:mn> 1</米米l:米n> </mml:msub> <mml:mo stretchy="false"> (</米米l:米o> <mml:mi> g</米米l:米我> <mml:mo stretchy="false"> )</米米l:米o> <mml:mo> =</米米l:米o> <mml:mi> D</米米l:米我> <mml:mo stretchy="false"> (</米米l:米o> <mml:mi> g</米米l:米我> <mml:mo> −</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mi> π</米米l:米我> <mml:mo> /</米米l:米o> <mml:mi> N</米米l:米我> <mml:mo stretchy="false"> )</米米l:米o> </mml:mrow> </mml:math> </inline-formula>和<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M143"> <mml:mrow> <mml:msub> <mml:mi> D</米米l:米我> <mml:mn> 2</米米l:米n> </mml:msub> <mml:mo stretchy="false"> (</米米l:米o> <mml:mi> g</米米l:米我> <mml:mo stretchy="false"> )</米米l:米o> <mml:mo> =</米米l:米o> <mml:mi> D</米米l:米我> <mml:mo stretchy="false"> (</米米l:米o> <mml:mi> g</米米l:米我> <mml:mo> +</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mi> π</米米l:米我> <mml:mo> /</米米l:米o> <mml:mi> N</米米l:米我> <mml:mo stretchy="false"> )</米米l:米o> <mml:mo> 。</米米l:米o> </mml:mrow> </mml:math> </inline-formula>然后提出使用一种加法合成模型,其中每个音符是模仿和正弦曲线的基频的整数倍,与正弦曲线的相对优势给予注意演奏的音色。这种光谱域的方法已经使用以前执行加法合成,尤其是逆FFT的方法释放等等。(<xrgydF4y2Baef ref-type="bibr" rid="B26"> 42</xrgydF4y2Baef>]。</pgydF4y2Ba> <p>对于一个给定的音高和给定的谐波,个人的光谱级正弦曲线可以存储在一个矩阵的大小<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M144"> <mml:mrow> <mml:mi> n</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> h</米米l:米我> <mml:mn> ,</米米l:米n> </mml:mrow> </mml:math> </inline-formula>在哪里<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M145"> <mml:mrow> <mml:mi> n</米米l:米我> </mml:mrow> </mml:math> </inline-formula>箱子的数量,和<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M146"> <mml:mrow> <mml:mi> h</米米l:米我> </mml:mrow> </mml:math> </inline-formula>谐波的数量。这对每一个允许可以重复<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M147"> <mml:mrow> <mml:mi> z</米米l:米我> </mml:mrow> </mml:math> </inline-formula>指出,导致一个张量的大小<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M148"> <mml:mrow> <mml:mi> n</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> z</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> h</米米l:米我> </mml:mrow> </mml:math> </inline-formula>。实际上,这张量是一个信号组成的字典单个正弦信号的幅度谱与每个允许的泛音。以损害窗口为例,张量可以被定义为<gydF4y2Badisp-formula id="eq8"> <label>(9)</lgydF4y2Baabel> <mml:math altimg="C:\WINDOWS\Temp\MMLIMG25071.png" width="449" height="26" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M149"> <mml:mrow> <mml:mtable columnalign="left" width="auto" class="split"> <mml:mtr> <mml:mtd columnalign="right"></mml:mtd> <mml:mtd columnalign="left"> <mml:mrow> <mml:mi> ℋ</米米l:米我> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mi> x</米米l:米我> <mml:mn> ,</米米l:米n> <mml:mi> 我</米米l:米我> <mml:mn> ,</米米l:米n> <mml:mi> j</米米l:米我> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> )</米米l:米o> </mml:mrow> </mml:mrow> <mml:mrow> <mml:mrow> <mml:mo> =</米米l:米o> <mml:mo minsize="1em" maxsize="1em"> |</米米l:米o> <mml:mrow> <mml:mn> 0.5</米米l:米n> <mml:mi> D</米米l:米我> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> (</米米l:米o> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> g</米米l:米我> </mml:mrow> <mml:mrow> <mml:mi> x</米米l:米我> <mml:mi> 我</米米l:米我> <mml:mi> j</米米l:米我> </mml:mrow> </mml:msub> </mml:mrow> <mml:mo minsize="1em" maxsize="1em"> )</米米l:米o> </mml:mrow> <mml:mo> +</米米l:米o> <mml:mn> 0.25</米米l:米n> <mml:mo minsize="1em" maxsize="1em"> {</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> D</米米l:米我> </mml:mrow> <mml:mrow> <mml:mn> 1</米米l:米n> </mml:mrow> </mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> (</米米l:米o> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> g</米米l:米我> </mml:mrow> <mml:mrow> <mml:mi> x</米米l:米我> <mml:mi> 我</米米l:米我> <mml:mi> j</米米l:米我> </mml:mrow> </mml:msub> </mml:mrow> <mml:mo minsize="1em" maxsize="1em"> )</米米l:米o> </mml:mrow> <mml:mo> +</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> D</米米l:米我> </mml:mrow> <mml:mrow> <mml:mn> 2</米米l:米n> </mml:mrow> </mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> (</米米l:米o> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> g</米米l:米我> </mml:mrow> <mml:mrow> <mml:mi> x</米米l:米我> <mml:mi> 我</米米l:米我> <mml:mi> j</米米l:米我> </mml:mrow> </mml:msub> </mml:mrow> <mml:mo minsize="1em" maxsize="1em"> )</米米l:米o> </mml:mrow> <mml:mo minsize="1em" maxsize="1em"> }</米米l:米o> </mml:mrow> <mml:mo minsize="1em" maxsize="1em"> |</米米l:米o> </mml:mrow> <mml:mn> ,</米米l:米n> </mml:mrow> </mml:mtd> </mml:mtr> </mml:mtable> </mml:mrow> </mml:math> </disp-formula>在哪里<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M150"> <mml:mrow> <mml:msub> <mml:mi> g</米米l:米我> <mml:mrow> <mml:mi> x</米米l:米我> <mml:mi> 我</米米l:米我> <mml:mi> j</米米l:米我> </mml:mrow> </mml:msub> <mml:mo> =</米米l:米o> <mml:msub> <mml:mi> f</米米l:米我> <mml:mi> x</米米l:米我> </mml:msub> <mml:mo> −</米米l:米o> <mml:msub> <mml:mi> f</米米l:米我> <mml:mrow> <mml:mi> 我</米米l:米我> <mml:mn> ,</米米l:米n> <mml:mi> j</米米l:米我> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>与<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M151"> <mml:mrow> <mml:msub> <mml:mi> f</米米l:米我> <mml:mrow> <mml:mi> 我</米米l:米我> <mml:mn> ,</米米l:米n> <mml:mi> j</米米l:米我> </mml:mrow> </mml:msub> <mml:mo> =</米米l:米o> <mml:msub> <mml:mi> h</米米l:米我> <mml:mn> 0</米米l:米n> </mml:msub> <mml:msup> <mml:mi> β</米米l:米我> <mml:mrow> <mml:mi> 我</米米l:米我> <mml:mo> −</米米l:米o> <mml:mn> 1</米米l:米n> </mml:mrow> </mml:msup> <mml:mi> j</米米l:米我> <mml:mn> 2</米米l:米n> <mml:mi> π</米米l:米我> <mml:mo> /</米米l:米o> <mml:msub> <mml:mi> f</米米l:米我> <mml:mi> 年代</米米l:米我> </mml:msub> </mml:mrow> </mml:math> </inline-formula>,<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M152"> <mml:mrow> <mml:msub> <mml:mi> h</米米l:米我> <mml:mn> 0</米米l:米n> </mml:msub> </mml:mrow> </mml:math> </inline-formula>是赫兹的频率允许的最低的注意和<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M153"> <mml:mrow> <mml:mi> β</米米l:米我> </mml:mrow> </mml:math> </inline-formula>正如前面部分中定义吗<xrgydF4y2Baef ref-type="sec" rid="sec2"> 2</xrgydF4y2Baef>。这里假定等音阶调优,但也可以使用其他调优系统。</pgydF4y2Ba> <p>也可以考虑inharmonicity定位的泛音通过使用inharmonicity因素。例如,在仪器中包含字符串,<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M154"> <mml:mrow> <mml:msub> <mml:mi> f</米米l:米我> <mml:mrow> <mml:mi> 我</米米l:米我> <mml:mn> ,</米米l:米n> <mml:mi> j</米米l:米我> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>可以计算为<gydF4y2Badisp-formula id="eq9"> <label>(10)</lgydF4y2Baabel> <mml:math altimg="C:\WINDOWS\Temp\MMLIMG25077.png" width="206" height="38" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M155"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> f</米米l:米我> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:米我> <mml:mn> ,</米米l:米n> <mml:mi> j</米米l:米我> </mml:mrow> </mml:msub> <mml:mo> =</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> h</米米l:米我> </mml:mrow> <mml:mrow> <mml:mn> 0</米米l:米n> </mml:mrow> </mml:msub> <mml:msup> <mml:mrow> <mml:mi> β</米米l:米我> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:米我> <mml:mo> −</米米l:米o> <mml:mn> 1</米米l:米n> </mml:mrow> </mml:msup> <mml:mi> j</米米l:米我> <mml:mn> 2</米米l:米n> <mml:mi> π</米米l:米我> <mml:mfrac> <mml:mrow> <mml:msqrt> <mml:mrow> <mml:mn> 1</米米l:米n> <mml:mo> +</米米l:米o> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> (</米米l:米o> <mml:mrow> <mml:msup> <mml:mrow> <mml:mi> j</米米l:米我> </mml:mrow> <mml:mrow> <mml:mn> 2</米米l:米n> </mml:mrow> </mml:msup> <mml:mo> −</米米l:米o> <mml:mn> 1</米米l:米n> </mml:mrow> <mml:mo minsize="1em" maxsize="1em"> )</米米l:米o> </mml:mrow> <mml:mi> α</米米l:米我> </mml:mrow> </mml:msqrt> </mml:mrow> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> f</米米l:米我> </mml:mrow> <mml:mrow> <mml:mi> 年代</米米l:米我> </mml:mrow> </mml:msub> </mml:mrow> </mml:mfrac> <mml:mn> ,</米米l:米n> </mml:mrow> </mml:math> </disp-formula>在哪里<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M156"> <mml:mrow> <mml:mi> α</米米l:米我> </mml:mrow> </mml:math> </inline-formula>是仪器问题[inharmonicity因素<xrgydF4y2Baef ref-type="bibr" rid="B28"> 43</xrgydF4y2Baef>]。在实践中,将接近零级光谱除了在周围的地区<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M157"> <mml:mrow> <mml:msub> <mml:mi> f</米米l:米我> <mml:mrow> <mml:mi> 我</米米l:米我> <mml:mn> ,</米米l:米n> <mml:mi> j</米米l:米我> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>,因此它通常是足够的计算的值<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M158"> <mml:mrow> <mml:mi> </米米l:米我> <mml:mrow> <mml:mo stretchy="false"> (</米米l:米o> <mml:mrow> <mml:mi> x</米米l:米我> <mml:mn> ,</米米l:米n> <mml:mi> 我</米米l:米我> <mml:mn> ,</米米l:米n> <mml:mi> j</米米l:米我> </mml:mrow> <mml:mo stretchy="false"> )</米米l:米o> </mml:mrow> </mml:mrow> </mml:math> </inline-formula>十箱的两侧<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M159"> <mml:mrow> <mml:msub> <mml:mi> f</米米l:米我> <mml:mrow> <mml:mi> 我</米米l:米我> <mml:mn> ,</米米l:米n> <mml:mi> j</米米l:米我> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>和离开剩下的箱子为零。此外,频率最低的部分最低的注意,和最高的最高部分注意限制区域的光谱图将模仿,所以这些范围以外的频率谱图箱子可以被丢弃。如果需要少量的谐波,这可以大大减少计算所需的数量,从而加快了算法。</pgydF4y2Ba> <p> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M160"> <mml:mrow> <mml:mi> ℋ</米米l:米我> </mml:mrow> </mml:math> </inline-formula>包含所有相同的增益集谐波泛音。为了近似不同乐器的音色,这些泛音必须以不同的比例加权。这些权重可以存储在一个张量的大小<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M161"> <mml:mrow> <mml:mi> h</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> K</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> p</米米l:米我> <mml:mn> ,</米米l:米n> </mml:mrow> </mml:math> </inline-formula>在哪里<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M162"> <mml:mrow> <mml:mi> K</米米l:米我> </mml:mrow> </mml:math> </inline-formula>仪器的数量和吗<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M163"> <mml:mrow> <mml:mi> p</米米l:米我> </mml:mrow> </mml:math> </inline-formula>是翻译跨越时间的数量,从而使谐波权重随时间。标签的权重张量<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M164"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula>,该模型可以描述为<gydF4y2Badisp-formula id="eq10"> <label>(11)</lgydF4y2Baabel> <mml:math altimg="C:\WINDOWS\Temp\MMLIMG25093.png" width="392" height="31" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M165"> <mml:mrow> <mml:mi> </米米l:米我> <mml:mo> =</米米l:米o> <mml:mstyle> <mml:mrow> <mml:munderover> <mml:mrow> <mml:mstyle displaystyle="true"> <mml:mrow> <mml:mo> ∑</米米l:米o> </mml:mrow> </mml:mstyle> </mml:mrow> <mml:mrow> <mml:mi> k</米米l:米我> <mml:mo> =</米米l:米o> <mml:mn> 1</米米l:米n> </mml:mrow> <mml:mrow> <mml:mi> K</米米l:米我> </mml:mrow> </mml:munderover> </mml:mrow> </mml:mstyle> <mml:msub> <mml:mrow> <mml:mo minsize="1.5em" maxsize="1.5em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mo minsize="1.25em" maxsize="1.25em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:mi> ℋ</米米l:米我> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mi> </米米l:米我> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mo minsize="1.25em" maxsize="1.25em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 4</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mo minsize="1.5em" maxsize="1.5em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mn> 。</米米l:米n> </mml:mrow> </mml:math> </disp-formula>使用普遍Kullback-Leibler散度作为一个成本函数,乘法更新方程可以推导出<gydF4y2Badisp-formula id="eq11"> <label>(12)</lgydF4y2Baabel> <mml:math altimg="C:\WINDOWS\Temp\MMLIMG25106.png" width="394" height="136" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M166"> <mml:mrow> <mml:mtable columnalign="left" width="auto" class="split"> <mml:mtr> <mml:mtd columnalign="right"> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> </mml:mtd> <mml:mtd columnalign="left"> <mml:mrow> <mml:mo> =</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo> ⊗</米米l:米o> </mml:mrow> <mml:mfrac> <mml:mrow> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> 〈</米米l:米o> <mml:mi> </米米l:米我> <mml:mi> ℋ</米米l:米我> <mml:mo minsize="0.75em" maxsize="0.75em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 4</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 4</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mi> </米米l:米我> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 4</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> </mml:mrow> <mml:mrow> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> 〈</米米l:米o> <mml:mi> </米米l:米我> <mml:mi> ℋ</米米l:米我> <mml:mo minsize="0.75em" maxsize="0.75em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 4</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 4</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mi> </米米l:米我> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 4</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> </mml:mrow> </mml:mfrac> <mml:mo> ,</米米l:米o> </mml:mtd> </mml:mtr> <mml:mtr> <mml:mtd columnalign="right"> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> </mml:mtd> <mml:mtd columnalign="left"> <mml:mrow> <mml:mo> =</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo> ⊗</米米l:米o> </mml:mrow> <mml:mfrac> <mml:mrow> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> (</米米l:米o> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo> ∘</米米l:米o> <mml:mi> ℋ</米米l:米我> </mml:mrow> <mml:mo minsize="1em" maxsize="1em"> )</米米l:米o> </mml:mrow> <mml:mi> </米米l:米我> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 1、3</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mn> ,1</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mi> </米米l:米我> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 1、2、4</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mn> ,</米米l:米n> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 1、2、4</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> </mml:mrow> <mml:mrow> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> (</米米l:米o> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo> ∘</米米l:米o> <mml:mi> ℋ</米米l:米我> </mml:mrow> <mml:mo minsize="1em" maxsize="1em"> )</米米l:米o> </mml:mrow> <mml:mi> </米米l:米我> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 1、3</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mn> ,1</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mi> </米米l:米我> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 1、2、4</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mn> ,</米米l:米n> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 1、2、4</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> </mml:mrow> </mml:mfrac> <mml:mo> ,</米米l:米o> </mml:mtd> </mml:mtr> <mml:mtr> <mml:mtd columnalign="right"> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> </mml:mtd> <mml:mtd columnalign="left"> <mml:mrow> <mml:mo> =</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo> ⊗</米米l:米o> </mml:mrow> <mml:mfrac> <mml:mrow> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> (</米米l:米o> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo> ∘</米米l:米o> <mml:mi> ℋ</米米l:米我> </mml:mrow> <mml:mo minsize="1em" maxsize="1em"> )</米米l:米o> </mml:mrow> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 2、5</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mn> ,</米米l:米n> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 2、1</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mi> </米米l:米我> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mi> </米米l:米我> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 2、1</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> </mml:mrow> <mml:mrow> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> (</米米l:米o> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo> ∘</米米l:米o> <mml:mi> ℋ</米米l:米我> </mml:mrow> <mml:mo minsize="1em" maxsize="1em"> )</米米l:米o> </mml:mrow> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 2、5</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mn> ,</米米l:米n> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 2、1</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mi> </米米l:米我> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mi> </米米l:米我> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 2、1</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> </mml:mrow> </mml:mfrac> <mml:mo> ,</米米l:米o> </mml:mtd> </mml:mtr> </mml:mtable> </mml:mrow> </mml:math> </disp-formula>在哪里<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M167"> <mml:mrow> <mml:mi> </米米l:米我> <mml:mo> =</米米l:米o> <mml:mi> </米米l:米我> <mml:mo> ⊘</米米l:米o> <mml:mover accent="true"> <mml:mi> </米米l:米我> <mml:mo> ^</米米l:米o> </mml:mover> </mml:mrow> </mml:math> </inline-formula>和<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M168"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula>是一个所有张量和尺寸一样吗<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M169"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula>,所有部门都作为elementwise。</pgydF4y2Ba> <p>这些更新方程SNTF类似,只是取代<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M170"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula>和<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M171"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula>正弦信号的字典<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M172"> <mml:mrow> <mml:mi> ℋ</米米l:米我> </mml:mrow> </mml:math> </inline-formula>,一组谐波权重<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M173"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula>,分别。拟称之为新算法<我talic> 正弦转二维非负张量factorisation</我talic>(SSNTF)显式模型信号的加权总和谐波相关血窦,实际上是将一个加法合成模型纳入张factorisation框架。SSNTF仍然可以被视为移不变的频率,随着谐波重量不变的频谱notes发生。</pgydF4y2Ba> <p>SSNTF的一个优势是,分离的问题是现在完全制定在线性频域,从而避免了使用一个近似对数线性频域的映射算法在任何时候,它消除了潜在的再合成构件由于映射。再合成的分离时域波形可以以类似的方式进行SNTF,或者,一个可以利用的使用添加剂合成模型重建使用加法合成分离信号。</pgydF4y2Ba> <p>SSNTF算法在Matlab实现使用张量工具箱可以从[<xrgydF4y2Baef ref-type="bibr" rid="B47"> 44</xrgydF4y2Baef>),本文中描述的所有后续算法。成本函数总是观察减少每次迭代。然而,当运行SSNTF,发现最好的结果,给出的算法估计有每个源的频率区域。这通常是通过给予的最低音的音高估计每个源。score-assisted分离,如提出的(<xrgydF4y2Baef ref-type="bibr" rid="B29"> 45</xrgydF4y2Baef>),这些信息将现成的。整合这些信息的好处是固定的顺序在大多数情况下。在没有得分的情况下,估计可以通过运行SNTF首先确定音高信息恢复基函数在运行SSNTF之前。目前,研究正在开展设计替代方法克服这个问题。</pgydF4y2Ba> <p>作为一个例子SSNTF可以提供的改进后的重建,人物<xrgydF4y2Baef ref-type="fig" rid="fig1"> 1</xrgydF4y2Baef>显示了频谱的长笛注意分开单通道长笛和钢琴。SNTF和SSNTF上执行这个例子使用频率和5 9翻译翻译。所有其他参数都设置为在描述部分<xrgydF4y2Baef ref-type="sec" rid="sec6"> 6</xrgydF4y2Baef>。第一光谱的长笛注意从最初的纯粹的长笛波形,第二个频谱使用SNTF恢复长笛的注意,与从日志到线性域包含在模型的映射,而第三光谱是由SSNTF返回。可以欣赏,返回的频谱SSNTF相当接近原比SNTF返回的。这演示了使用一个方法的实用程序制定的线性频域。</pgydF4y2Ba> <fig-group id="fig1"> <p>光谱的长笛,原始,SNTF SSNTF,分别。</pgydF4y2Ba> <fig id="fig1a"> <label>(一)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.001a"></graphic> </fig> <fig id="fig1b"> <label>(b)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.001b"></graphic> </fig> <fig id="fig1c"> <label>(c)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.001c"></graphic> </fig> </fig-group> <p>图<xrgydF4y2Baef ref-type="fig" rid="fig2"> 2</xrgydF4y2Baef>显示了钢琴和长笛的原始混合物光谱图,而图<xrgydF4y2Baef ref-type="fig" rid="fig3a"> 3(一个)</xrgydF4y2Baef>显示了纯粹的长笛声谱图,数据<xrgydF4y2Baef ref-type="fig" rid="fig3b"> 3 (b)</xrgydF4y2Baef>,<xrgydF4y2Baef ref-type="fig" rid="fig3c"> 3 (c)</xrgydF4y2Baef>,<xrgydF4y2Baef ref-type="fig" rid="fig3d"> 3 (d)</xrgydF4y2Baef>SNTF-separated笛谱图显示,使用refiltering SNTF-separated笛谱图,分别和SSNTF-separated谱图。图<xrgydF4y2Baef ref-type="fig" rid="fig4a"> 4(一)</xrgydF4y2Baef>显示的是纯粹的钢琴谱图数据<xrgydF4y2Baef ref-type="fig" rid="fig4b"> 4 (b)</xrgydF4y2Baef>,<xrgydF4y2Baef ref-type="fig" rid="fig4c"> 4 (c)</xrgydF4y2Baef>,<xrgydF4y2Baef ref-type="fig" rid="fig4d"> 4 (d)</xrgydF4y2Baef>显示SNTF-separated钢琴谱图,使用refiltering SNTF-separated钢琴谱图得到,分别和SSNTF-separated谱图。可以看出,声音恢复使用SSNTF相当接近原始谱图比直接从SNTF恢复,涂抹的地方由于近似对数线性域的映射显然是明显的。大大改善了复苏的来源还指出在回放分离SSNTF信号相比,那些获得直接使用SNTF。获得的谱图使用SNTF结合refiltering也可以看作是相当接近原始的声音比任何其他方法。然而,在听,音质仍低于使用SSNTF获得。此外,稍后将看到的,SNTF-based方法不如SSNTF-based健壮的方法。</pgydF4y2Ba> <fig id="fig2"> <label>图2</lgydF4y2Baabel> <p>谱图的钢琴和长笛的混合物。</pgydF4y2Ba> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.002"></graphic> </fig> <fig-group id="fig3"> <p>长笛的谱图信号,原始纯粹的(a), (b) SNTF, (c)再过滤SNTF, (d) SSNTF, (e) source-filter SSNTF。</pgydF4y2Ba> <fig id="fig3a"> <label>(一)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.003a"></graphic> </fig> <fig id="fig3b"> <label>(b)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.003b"></graphic> </fig> <fig id="fig3c"> <label>(c)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.003c"></graphic> </fig> <fig id="fig3d"> <label>(d)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.003d"></graphic> </fig> <fig id="fig3e"> <label>(e)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.003e"></graphic> </fig> </fig-group> <fig-group id="fig4"> <p>钢琴谱图信号,原始纯粹的(a), (b) SNTF, (c)再过滤SNTF, (d) SSNTF, (e) source-filter SSNTF。</pgydF4y2Ba> <fig id="fig4a"> <label>(一)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.004a"></graphic> </fig> <fig id="fig4b"> <label>(b)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.004b"></graphic> </fig> <fig id="fig4c"> <label>(c)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.004c"></graphic> </fig> <fig id="fig4d"> <label>(d)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.004d"></graphic> </fig> <fig id="fig4e"> <label>(e)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.004e"></graphic> </fig> </fig-group> <p>还应该指出的是,除了谐波的限制强加限制返回的解决方案,可以factorisation算法。这是相当大的好处将额外的参数纳入模型时,将在以下部分中看到。</pgydF4y2Ba> </sec> <sec sec-type="section" id="sec4"> <title>4所示。Source-Filter造型</t我tle> <p>如前所述<xrgydF4y2Baef ref-type="sec" rid="sec2"> 2</xrgydF4y2Baef>,使用一个单一的仪器基函数转向模型不同的音符演奏乐器是一种简化。在实践中,指出由给定的乐器的音色改变音高,这限制了factorisation转移模型的有效性。最近,维尔塔宁和Klapuri source-filter模型方法的提出了合并factorisation克服这个问题的方法是(<xrgydF4y2Baef ref-type="bibr" rid="B30"> 46</xrgydF4y2Baef>]。source-filter框架的发声,源通常是一个振动的物体,如小提琴弦,和滤波器的谐振结构占乐器,如小提琴的身体,改变和过滤器的声音振动产生的对象。这种方法被使用之前在这两个声音合成和语音编码(<xrgydF4y2Baef ref-type="bibr" rid="B31"> 47</xrgydF4y2Baef>,<xrgydF4y2Baef ref-type="bibr" rid="B32"> 48</xrgydF4y2Baef>),但不是factorisation框架。</pgydF4y2Ba> <p>当应用于转移仪器基函数的上下文中,仪器基函数代表一个谐波激励模式,可以上下移动的频率来生成不同的音高。单个固定滤波器应用于这些翻译激励模式,与代表乐器的共振结构的滤波器。这个结果在一个乐器音色的系统随音高,导致一个更现实的模型。仪器共振峰过滤器可以被纳入了张量factorisation框架通过共振峰滤波器张量<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M174"> <mml:mrow> <mml:mi> ℱ</米米l:米我> </mml:mrow> </mml:math> </inline-formula>的大小<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M175"> <mml:mrow> <mml:mi> n</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> K</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> n</米米l:米我> </mml:mrow> </mml:math> </inline-formula>。在这种情况下,<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M176"> <mml:mrow> <mml:mi> k</米米l:米我> </mml:mrow> </mml:math> </inline-formula>th片<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M177"> <mml:mrow> <mml:mi> ℱ</米米l:米我> </mml:mrow> </mml:math> </inline-formula>是一个对角矩阵,仪器包含对角线上共振峰滤波器系数。</pgydF4y2Ba> <p>不幸的是,试图source-filter模型合并到SNTF框架,但均没有成功。合成算法有太多的参数优化和很难获得良好的分离效果。然而,额外的限制SSNTF被发现使问题容易处理。合成模型可以描述为<gydF4y2Badisp-formula id="eq14"> <label>(13)</lgydF4y2Baabel> <mml:math altimg="C:\WINDOWS\Temp\MMLIMG25200.png" width="451" height="33" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M178"> <mml:mrow> <mml:mtable class="split" width="auto" columnalign="left"> <mml:mtr columnalign="left"> <mml:mtd columnalign="right"> <mml:mi> </米米l:米我> </mml:mtd> <mml:mtd columnalign="left"> <mml:mrow> <mml:mo> ≈</米米l:米o> <mml:mover accent="true"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> ^</米米l:米o> </mml:mrow> </mml:mover> </mml:mrow> <mml:mo> =</米米l:米o> <mml:mrow> <mml:mstyle> <mml:mrow> <mml:munderover> <mml:mrow> <mml:mstyle displaystyle="true"> <mml:mrow> <mml:mo> ∑</米米l:米o> </mml:mrow> </mml:mstyle> </mml:mrow> <mml:mrow> <mml:mi> k</米米l:米我> <mml:mo> =</米米l:米o> <mml:mn> 1</米米l:米n> </mml:mrow> <mml:mrow> <mml:mi> K</米米l:米我> </mml:mrow> </mml:munderover> </mml:mrow> </mml:mstyle> <mml:msub> <mml:mrow> <mml:mo minsize="1.5em" maxsize="1.5em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mo minsize="1.25em" maxsize="1.25em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> ℛ</米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 2、4</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mn> ,</米米l:米n> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 2、1</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo minsize="1.25em" maxsize="1.25em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 4</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 2,1,3</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mo minsize="1.5em" maxsize="1.5em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mn> ,</米米l:米n> </mml:mrow> </mml:mtd> </mml:mtr> </mml:mtable> </mml:mrow> </mml:math> </disp-formula>在哪里<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M179"> <mml:mrow> <mml:msub> <mml:mi> ℛ</米米l:米我> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo> =</米米l:米o> <mml:msub> <mml:mrow> <mml:mo stretchy="false"> 〈</米米l:米o> <mml:msub> <mml:mi> ℱ</米米l:米我> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mi> ℋ</米米l:米我> <mml:mo stretchy="false"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo stretchy="false"> {</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo stretchy="false"> }</米米l:米o> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>和<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M180"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo> =</米米l:米o> <mml:msub> <mml:mrow> <mml:mo stretchy="false"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mi> </米米l:米我> <mml:mo stretchy="false"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo stretchy="false"> {</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo stretchy="false"> }</米米l:米o> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>。</pgydF4y2Ba> <p>再次使用普遍Kullback-Lieber散度作为一个成本函数,以下更新方程推导出:<gydF4y2Badisp-formula id="eq0013"> <label>(14)</lgydF4y2Baabel> <mml:math altimg="C:\WINDOWS\Temp\MMLIMG25221.png" width="433" height="179" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M181"> <mml:mrow> <mml:mtable class="split" width="auto" columnalign="left"> <mml:mtr> <mml:mtd columnalign="right"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> </mml:mrow> </mml:mtd> <mml:mtd columnalign="left"> <mml:mrow> <mml:mo> =</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo> ⊗</米米l:米o> <mml:mfrac> <mml:mrow> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:mi> </米米l:米我> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> ℛ</米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 2、4</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mn> ,</米米l:米n> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 2、1</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 5</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 4、2、1,3</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> </mml:mrow> <mml:mrow> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:mi> </米米l:米我> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> ℛ</米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 2、4</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mn> ,</米米l:米n> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 2、1</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 5</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 4、2、1,3</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> </mml:mrow> </mml:mfrac> <mml:mn> ,</米米l:米n> </mml:mrow> </mml:mtd> </mml:mtr> <mml:mtr> <mml:mtd columnalign="right"> <mml:msub> <mml:mrow> <mml:mi> ℱ</米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> </mml:mtd> <mml:mtd columnalign="left"> <mml:mrow> <mml:mo> =</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> ℱ</米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo> ⊗</米米l:米o> </mml:mrow> <mml:mfrac> <mml:mrow> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mi> </米米l:米我> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:mi> ℋ</米米l:米我> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 4</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 1、3</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mn> ,2</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> </mml:mrow> <mml:mrow> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mi> </米米l:米我> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:mi> ℋ</米米l:米我> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 4</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 1、3</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mn> ,2</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> </mml:mrow> </mml:mfrac> <mml:mo> ,</米米l:米o> </mml:mtd> </mml:mtr> <mml:mtr> <mml:mtd columnalign="right"> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> </mml:mtd> <mml:mtd columnalign="left"> <mml:mrow> <mml:mo> =</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo> ⊗</米米l:米o> </mml:mrow> <mml:mfrac> <mml:mrow> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mi> ℛ</米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mi> </米米l:米我> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 1、3</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mn> ,1</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 1、2、4</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mn> ,</米米l:米n> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 2、1、4</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> </mml:mrow> <mml:mrow> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mi> ℛ</米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mi> </米米l:米我> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 1、3</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mn> ,1</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 1、2、4</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mn> ,</米米l:米n> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 2、1、4</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> </mml:mrow> </mml:mfrac> <mml:mo> ,</米米l:米o> </mml:mtd> </mml:mtr> <mml:mtr> <mml:mtd columnalign="right"> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> </mml:mtd> <mml:mtd columnalign="left"> <mml:mrow> <mml:mo> =</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo> ⊗</米米l:米o> </mml:mrow> <mml:mrow> <mml:mfrac> <mml:mrow> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> ℛ</米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 2、4</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mn> ,</米米l:米n> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 2、1</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> 〈</米米l:米o> <mml:mi> </米米l:米我> <mml:mi> </米米l:米我> <mml:mo minsize="0.75em" maxsize="0.75em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 1、3、5</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mn> ,1</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> </mml:mrow> <mml:mrow> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> ℛ</米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 2、4</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mn> ,</米米l:米n> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 2、1</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> 〈</米米l:米o> <mml:mi> </米米l:米我> <mml:mi> </米米l:米我> <mml:mo minsize="0.75em" maxsize="0.75em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 1、3、5</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mn> ,1</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> </mml:mrow> </mml:mfrac> <mml:mn> 。</米米l:米n> </mml:mrow> </mml:mtd> </mml:mtr> </mml:mtable> </mml:mrow> </mml:math> </disp-formula>图<xrgydF4y2Baef ref-type="fig" rid="fig5"> 5</xrgydF4y2Baef>长笛的示例显示了过滤器恢复以前章节中讨论<xrgydF4y2Baef ref-type="sec" rid="sec3"> 3</xrgydF4y2Baef>。可以看出,恢复过滤器由一系列的峰值相对于光滑formant-like过滤器。这是由于两个因素的结合,首先,小数量的不同的音符在原始信号,其次,SSNTF谐波限制。这导致情况的大部分频谱将有很少或没有能量,这些区域和相应的过滤器模型具有很少或没有能量。</pgydF4y2Ba> <fig id="fig5"> <label>图5</lgydF4y2Baabel> <p>过滤器返回长笛在使用source-filter SSNTF。</pgydF4y2Ba> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.005"></graphic> </fig> <p>听的再合成,显著改善音质的长笛与SSNTF相比,用更少的高频能量。钢琴的再合成也有所改善,尽管那么的长笛。数据<xrgydF4y2Baef ref-type="fig" rid="fig3e"> 3 (e)</xrgydF4y2Baef>和<xrgydF4y2Baef ref-type="fig" rid="fig4e"> 4 (e)</xrgydF4y2Baef>显示谱图恢复使用source-filter SSNTF长笛和钢琴。它可以观察到,笛子声谱图比SNTF或接近原SSNTF,没有拖尾,减少高次谐波的存在SSNTF相比,这是符合所观察到的听再合成。SNTF和refiltering方法相比,source-filter SSNTF比再过滤方法,保留了更多的高频信息,可以看到更接近原始光谱图。在钢琴的情况下,再过滤声谱图包含的高频信息比source-filter SSNTF方法,这是接近原来的钢琴谱图。听,source-filter SSNTF方法也优于再过滤SNTF方法。</pgydF4y2Ba> <p>作为进一步的例子source-filter SSNTF,图<xrgydF4y2Baef ref-type="fig" rid="fig6a"> 6(一)</xrgydF4y2Baef>显示一个长笛的谱图信号组成的16所指出的,接收分开在升序排序,而数字<xrgydF4y2Baef ref-type="fig" rid="fig6b"> 6 (b)</xrgydF4y2Baef>和<xrgydF4y2Baef ref-type="fig" rid="fig6c"> 6 (c)</xrgydF4y2Baef>显示谱图恢复使用source-filter SSNTF SSNTF,分别。可以看出source-filter方法返回一个谱图接近原始,不如SSNTF高频信息。图<xrgydF4y2Baef ref-type="fig" rid="fig7"> 7</xrgydF4y2Baef>显示了source-filter与图有关<xrgydF4y2Baef ref-type="fig" rid="fig6b"> 6 (b)</xrgydF4y2Baef>。可以看出,在这种情况下,连续16个音符,source-filter流畅,作为formant-like预计将过滤器,但随着谐波得到进一步分开,peakiness相似图的证据<xrgydF4y2Baef ref-type="fig" rid="fig5"> 5</xrgydF4y2Baef>变得更加明显。</pgydF4y2Ba> <fig-group id="fig6"> <p>谱图的原始笛谱图(a), (b)谱图恢复使用source-filter SSNTF,并使用SSNTF (c)谱图恢复。</pgydF4y2Ba> <fig id="fig6a"> <label>(一)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.006a"></graphic> </fig> <fig id="fig6b"> <label>(b)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.006b"></graphic> </fig> <fig id="fig6c"> <label>(c)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.006c"></graphic> </fig> </fig-group> <fig id="fig7"> <label>图7</lgydF4y2Baabel> <p>过滤器返回独奏长笛在图示例<xrgydF4y2Baef ref-type="fig" rid="fig6"> 6</xrgydF4y2Baef>当使用source-filter SSNTF。</pgydF4y2Ba> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.007"></graphic> </fig> <p>上面的示例演示使用source-filter方法的效用的提高SSNTF模型的准确性。这是境界的提高再合成分离的来源。</pgydF4y2Ba> </sec> <sec sec-type="section" id="sec5"> <title>5。分离和Nonpitched仪器</t我tle> <p>音乐信号,尤其是流行音乐,通常包含音高工具,如鼓声除了定位工具。同时允许移不变性在两个频率和时间适用于分离混合物的定位仪器,它是不适合处理打击乐器如陷阱和踢鼓,或其他形式的噪音。这些打击乐器可以成功地捕捉到算法只允许移不变性时间不使用频移不变性。为了处理音乐信号包含定位和敲击乐器或包含额外的噪音,需要有一个算法处理这两种情况下。这可以通过简单地增加两个模型在一起。这曾是由维尔塔宁的上下文中矩阵factorisation算法(<xrgydF4y2Baef ref-type="bibr" rid="B1"> 13</xrgydF4y2Baef>),他还指出,由此产生的模型太复杂才能获得良好的效果没有增加额外的约束。特别是,使用低性约束是必需的,尽管在这种情况下它是基于零位调整仪器基函数的地区没有谐波活动预期,而不是添加剂合成技术提出了。</pgydF4y2Ba> <p>扩展概念的情况下张量factorisation技术导致了普遍的张量factorisation模型分离的定位和敲击乐器,它仍然允许使用source-filter模型定位工具。模型可以描述的<gydF4y2Badisp-formula id="eq19"> <label>(15)</lgydF4y2Baabel> <mml:math altimg="C:\WINDOWS\Temp\MMLIMG25298.png" width="454" height="75" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M182"> <mml:mrow> <mml:mtable class="split" width="auto" columnalign="left"> <mml:mtr> <mml:mtd columnalign="right"> <mml:mi> </米米l:米我> <mml:mo> ≈</米米l:米o> <mml:mover accent="true"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> ^</米米l:米o> </mml:mrow> </mml:mover> </mml:mtd> <mml:mtd columnalign="left"> <mml:mo> =</米米l:米o> <mml:mstyle> <mml:mrow> <mml:munderover> <mml:mrow> <mml:mstyle displaystyle="true"> <mml:mrow> <mml:mo> ∑</米米l:米o> </mml:mrow> </mml:mstyle> </mml:mrow> <mml:mrow> <mml:mi> k</米米l:米我> <mml:mo> =</米米l:米o> <mml:mn> 1</米米l:米n> </mml:mrow> <mml:mrow> <mml:mi> K</米米l:米我> </mml:mrow> </mml:munderover> </mml:mrow> </mml:mstyle> <mml:msub> <mml:mrow> <mml:mo minsize="1.25em" maxsize="1.25em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> ℛ</米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 2、4</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mn> ,</米米l:米n> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 2、1</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 4</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 2,1,3</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mo minsize="1.25em" maxsize="1.25em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> </mml:mtd> </mml:mtr> <mml:mtr> <mml:mtd columnalign="right"></mml:mtd> <mml:mtd columnalign="left"> <mml:mi> </mml:mi> <mml:mo> +</米米l:米o> <mml:mstyle> <mml:mrow> <mml:munderover> <mml:mrow> <mml:mstyle displaystyle="true"> <mml:mrow> <mml:mo> ∑</米米l:米o> </mml:mrow> </mml:mstyle> </mml:mrow> <mml:mrow> <mml:mi> l</米米l:米我> <mml:mo> =</米米l:米o> <mml:mn> 1</米米l:米n> </mml:mrow> <mml:mrow> <mml:mi> l</米米l:米我> </mml:mrow> </mml:munderover> </mml:mrow> </mml:mstyle> <mml:msub> <mml:mrow> <mml:mo minsize="1.25em" maxsize="1.25em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> ℳ</米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> l</米米l:米我> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> ℬ</米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> k</米米l:米我> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> l</米米l:米我> </mml:mrow> </mml:msub> <mml:mi> </米米l:米我> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mo minsize="1.25em" maxsize="1.25em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> <mml:mo> ,</米米l:米o> </mml:mrow> </mml:msub> </mml:mtd> </mml:mtr> </mml:mtable> </mml:mrow> </mml:math> </disp-formula>在哪里<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M183"> <mml:mrow> <mml:mi> ℳ</米米l:米我> </mml:mrow> </mml:math> </inline-formula>是一个张量的尺寸吗<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M184"> <mml:mrow> <mml:mi> r</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> l</米米l:米我> </mml:mrow> </mml:math> </inline-formula>,其中包含的每个的收益<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M185"> <mml:mrow> <mml:mi> l</米米l:米我> </mml:mrow> </mml:math> </inline-formula>敲击的来源,<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M186"> <mml:mrow> <mml:mi> ℬ</米米l:米我> </mml:mrow> </mml:math> </inline-formula>是一个张量的尺寸吗<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M187"> <mml:mrow> <mml:mi> n</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> l</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> 问</米米l:米我> <mml:mn> ,</米米l:米n> </mml:mrow> </mml:math> </inline-formula>在哪里<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M188"> <mml:mrow> <mml:mi> 问</米米l:米我> </mml:mrow> </mml:math> </inline-formula>是允许的数量时间变化冲击的来源,<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M189"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula>是一个张量的尺寸吗<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M190"> <mml:mrow> <mml:mi> l</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> 米</米米l:米我> <mml:mn> ,</米米l:米n> </mml:mrow> </mml:math> </inline-formula>和<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M191"> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> </mml:math> </inline-formula>翻译是一个张量尺寸<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M192"> <mml:mrow> <mml:mi> 米</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> 问</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> 米</米米l:米我> </mml:mrow> </mml:math> </inline-formula>。乘法更新方程,基于普遍Kullback-Leibler散度可以得到这些额外的参数,同时更新方程给出了所有其他参数部分<xrgydF4y2Baef ref-type="sec" rid="sec4"> 4</xrgydF4y2Baef>。额外的更新方程正解<gydF4y2Badisp-formula id="eq20"> <label>(16)</lgydF4y2Baabel> <mml:math altimg="C:\WINDOWS\Temp\MMLIMG25331.png" width="289" height="132" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M193"> <mml:mrow> <mml:mtable class="split" width="auto" columnalign="left"> <mml:mtr> <mml:mtd columnalign="right"> <mml:msub> <mml:mrow> <mml:mi> ℳ</米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> l</米米l:米我> </mml:mrow> </mml:msub> </mml:mtd> <mml:mtd columnalign="left"> <mml:mo> =</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> ℳ</米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> l</米米l:米我> </mml:mrow> </mml:msub> <mml:mo> ⊗</米米l:米o> <mml:mfrac> <mml:mrow> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:mi> </米米l:米我> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:mi> ℬ</米米l:米我> <mml:msub> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> 〈</米米l:米o> <mml:mi> </米米l:米我> <mml:mi> </米米l:米我> <mml:mo minsize="0.75em" maxsize="0.75em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 1、3</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> </mml:mrow> <mml:mrow> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:mi> </米米l:米我> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:mi> ℬ</米米l:米我> <mml:msub> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> 〈</米米l:米o> <mml:mi> </米米l:米我> <mml:mi> </米米l:米我> <mml:mo minsize="0.75em" maxsize="0.75em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> :</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 1、3</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> </mml:mrow> </mml:mfrac> <mml:mn> ,</米米l:米n> </mml:mtd> </mml:mtr> <mml:mtr> <mml:mtd columnalign="right"> <mml:msub> <mml:mrow> <mml:mi> ℬ</米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> l</米米l:米我> </mml:mrow> </mml:msub> </mml:mtd> <mml:mtd columnalign="left"> <mml:mo> =</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> ℬ</米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> l</米米l:米我> </mml:mrow> </mml:msub> <mml:mo> ⊗</米米l:米o> <mml:mfrac> <mml:mrow> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> ℳ</米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> l</米米l:米我> </mml:mrow> </mml:msub> <mml:mi> </米米l:米我> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> 〈</米米l:米o> <mml:mi> </米米l:米我> <mml:mi> </米米l:米我> <mml:mo minsize="0.75em" maxsize="0.75em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 1、3</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mn> ,</米米l:米n> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 1、3</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> </mml:mrow> <mml:mrow> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> ℳ</米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> l</米米l:米我> </mml:mrow> </mml:msub> <mml:mi> </米米l:米我> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> 〈</米米l:米o> <mml:mi> </米米l:米我> <mml:mi> </米米l:米我> <mml:mo minsize="0.75em" maxsize="0.75em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 1</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 1、3</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mn> ,</米米l:米n> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 1、3</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> </mml:mrow> </mml:mfrac> <mml:mn> ,</米米l:米n> </mml:mtd> </mml:mtr> <mml:mtr> <mml:mtd columnalign="right"> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> l</米米l:米我> </mml:mrow> </mml:msub> </mml:mtd> <mml:mtd columnalign="left"> <mml:mo> =</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> </米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> l</米米l:米我> </mml:mrow> </mml:msub> <mml:mo> ⊗</米米l:米o> <mml:mfrac> <mml:mrow> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> ℳ</米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> l</米米l:米我> </mml:mrow> </mml:msub> <mml:mi> ℬ</米米l:米我> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> 〈</米米l:米o> <mml:mi> </米米l:米我> <mml:mi> </米米l:米我> <mml:mo minsize="0.75em" maxsize="0.75em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 1、3、4</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mn> ,</米米l:米n> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 1、2、4</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> </mml:mrow> <mml:mrow> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mo minsize="1em" maxsize="1em"> 〈</米米l:米o> <mml:msub> <mml:mrow> <mml:mi> ℳ</米米l:米我> </mml:mrow> <mml:mrow> <mml:mo> :</米米l:米o> <mml:mi> l</米米l:米我> </mml:mrow> </mml:msub> <mml:mi> ℬ</米米l:米我> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 2</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> 〈</米米l:米o> <mml:mi> </米米l:米我> <mml:mi> </米米l:米我> <mml:mo minsize="0.75em" maxsize="0.75em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo> ,</米米l:米o> <mml:mn> 3</米米l:米n> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> <mml:mo minsize="1em" maxsize="1em"> 〉</米米l:米o> </mml:mrow> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> {</米米l:米o> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 1、3、4</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mn> ,</米米l:米n> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:米o> <mml:mrow> <mml:mn> 1、2、4</米米l:米n> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> ]</米米l:米o> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> }</米米l:米o> </mml:mrow> </mml:msub> </mml:mrow> </mml:mfrac> <mml:mn> 。</米米l:米n> </mml:mtd> </mml:mtr> </mml:mtable> </mml:mrow> </mml:math> </disp-formula>个人来源可以被分离和之前一样,但该算法也可以用于分离搭乐器的音高敲击乐器,反之亦然,再合成模型的相关部分。它也可以被用来作为一种手段,消除噪音把仪器的混合物作为一种“垃圾收集器,”在某些情况下可以提高再合成质量。它也可以被认为是类似于添加剂+残余正弦分析技术所描述的塞拉(<xrgydF4y2Baef ref-type="bibr" rid="B49"> 49</xrgydF4y2Baef>),它允许投或正弦信号的一部分分开再合成噪声信号的一部分。</pgydF4y2Ba> <p>作为一个例子使用的组合模型,图<xrgydF4y2Baef ref-type="fig" rid="fig8"> 8</xrgydF4y2Baef>显示了混合色从立体声获得混合物包含三个定位仪器,钢琴,长笛,喇叭,和三个打击乐器,陷阱,踩镲,和踢鼓,而图<xrgydF4y2Baef ref-type="fig" rid="fig9"> 9</xrgydF4y2Baef>分别显示了原始纯粹的声音的来源。钢琴、陷阱和踢鼓都是翻版的中心,踩镲和长笛翻版midleft小号midright。图<xrgydF4y2Baef ref-type="fig" rid="fig10"> 10</xrgydF4y2Baef>显示了使用组合模型分离获得的谱图。可以看出,来源已经恢复得很好,与每个仪器的其他来源的痕迹中可以看到色。这是最明显的痕迹踩镲网罗谱图是可见的,但显然网罗主导。听结果,笛子的痕迹也可以听到钢琴的信号,和乐器的音色已经改变,但仍可识别的仪器。的例子也强调了张量factorisation模型的另一个优点,即能够单独的仪器,在音响领域有相同的地位。这与算法如地址和合唱,只能单独来源如果他们在音响领域占据不同的位置<xrgydF4y2Baef ref-type="bibr" rid="B50"> 26</xrgydF4y2Baef>,<xrgydF4y2Baef ref-type="bibr" rid="B51"> 50</xrgydF4y2Baef>]。</pgydF4y2Ba> <fig-group id="fig8"> <p>混合色的钢琴、长笛、小号、陷阱,踩镲,踢鼓。</pgydF4y2Ba> <fig id="fig8a"> <label>(一)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.008a"></graphic> </fig> <fig id="fig8b"> <label>(b)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.008b"></graphic> </fig> </fig-group> <fig-group id="fig9"> <p>原始谱图(a)的钢琴,(b)长笛、小号(c), (f)陷阱(g)踩镲,(h)踢鼓。</pgydF4y2Ba> <fig id="fig9a"> <label>(一)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.009a"></graphic> </fig> <fig id="fig9b"> <label>(b)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.009b"></graphic> </fig> <fig id="fig9c"> <label>(c)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.009c"></graphic> </fig> <fig id="fig9d"> <label>(d)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.009d"></graphic> </fig> <fig id="fig9e"> <label>(e)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.009e"></graphic> </fig> <fig id="fig9f"> <label>(f)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.009f"></graphic> </fig> </fig-group> <fig-group id="fig10"> <p>分离谱图(a)的钢琴,(b)长笛、小号(c), (f)陷阱(g)踩镲和底鼓(h)。</pgydF4y2Ba> <fig id="fig10a"> <label>(一)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.010a"></graphic> </fig> <fig id="fig10b"> <label>(b)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.010b"></graphic> </fig> <fig id="fig10c"> <label>(c)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.010c"></graphic> </fig> <fig id="fig10d"> <label>(d)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.010d"></graphic> </fig> <fig id="fig10e"> <label>(e)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.010e"></graphic> </fig> <fig id="fig10f"> <label>(f)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.010f"></graphic> </fig> </fig-group> </sec> <sec sec-type="section" id="sec6"> <title>6。绩效评估</t我tle> <p>SNTF的表演,SNTF使用refiltering SSNTF, source-filter SSNTF,和source-filter SSNTF与噪声基函数的上下文中造型的混合物搭仪器比较使用一组40测试混合物。对于source-filter SSNTF噪声基函数,两个噪声基函数学习为了帮助消除噪音和工件的谐波源。4秒40测试信号的持续时间和含有混合的旋律由不同的仪器和由使用一个大型图书馆的管弦乐的样品(<xrgydF4y2Baef ref-type="bibr" rid="B48"> 51</xrgydF4y2Baef>]。样本共有15个不同的管弦乐器。广泛的球都淹没了,87赫兹至1.5千赫,旋律由个人工具在每个测试信号在和谐。这样做是为了确保测试谐波信号包含大量重叠,当这发生在大多数现实世界音乐信号。在许多情况下,指出了一个仪器重叠指出了另一个仪器测试算法是否能够识别相同音高的笔记由不同的乐器。</pgydF4y2Ba> <p>40测试信号由20个单通道的混合物2仪器和20立体声3仪器的混合物,这些混合物是由单独的单通道仪器的线性混合信号。在单通道的混合物中,源信号混合单位增益,和音响的混合物,混合是根据完成的<gydF4y2Badisp-formula id="eq0021"> <label>(17)</lgydF4y2Baabel> <mml:math altimg="C:\WINDOWS\Temp\MMLIMG25374.png" width="270" height="86" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M194"> <mml:mrow> <mml:mrow> <mml:mo class="pmatrix"> (</米米l:米o> <mml:mrow> <mml:mtable class="pmatrix"> <mml:mtr> <mml:mtd> <mml:mrow> <mml:msub> <mml:mi> x</米米l:米我> <mml:mn> 1</米米l:米n> </mml:msub> <mml:mo stretchy="false"> (</米米l:米o> <mml:mi> t</米米l:米我> <mml:mo stretchy="false"> )</米米l:米o> </mml:mrow> </mml:mtd> </mml:mtr> <mml:mtr> <mml:mtd> <mml:mrow> <mml:msub> <mml:mi> x</米米l:米我> <mml:mn> 2</米米l:米n> </mml:msub> <mml:mo stretchy="false"> (</米米l:米o> <mml:mi> t</米米l:米我> <mml:mo stretchy="false"> )</米米l:米o> </mml:mrow> </mml:mtd> </mml:mtr> </mml:mtable> </mml:mrow> <mml:mo class="pmatrix"> )</米米l:米o> </mml:mrow> <mml:mo> =</米米l:米o> <mml:mrow> <mml:mo class="pmatrix"> (</米米l:米o> <mml:mrow> <mml:mtable class="pmatrix"> <mml:mtr> <mml:mtd> <mml:mrow> <mml:mn> 0.75</米米l:米n> </mml:mrow> </mml:mtd> <mml:mtd> <mml:mrow> <mml:mn> 0.5</米米l:米n> </mml:mrow> </mml:mtd> <mml:mtd> <mml:mrow> <mml:mn> 0.25</米米l:米n> </mml:mrow> </mml:mtd> </mml:mtr> <mml:mtr> <mml:mtd> <mml:mrow> <mml:mn> 0.25</米米l:米n> </mml:mrow> </mml:mtd> <mml:mtd> <mml:mrow> <mml:mn> 0.5</米米l:米n> </mml:mrow> </mml:mtd> <mml:mtd> <mml:mrow> <mml:mn> 0.75</米米l:米n> </mml:mrow> </mml:mtd> </mml:mtr> </mml:mtable> </mml:mrow> <mml:mo class="pmatrix"> )</米米l:米o> </mml:mrow> <mml:mtext> </mml:mtext> <mml:mrow> <mml:mo class="pmatrix"> (</米米l:米o> <mml:mrow> <mml:mtable class="pmatrix"> <mml:mtr> <mml:mtd> <mml:mrow> <mml:msub> <mml:mi> 年代</米米l:米我> <mml:mn> 1</米米l:米n> </mml:msub> <mml:mo stretchy="false"> (</米米l:米o> <mml:mi> t</米米l:米我> <mml:mo stretchy="false"> )</米米l:米o> </mml:mrow> </mml:mtd> </mml:mtr> <mml:mtr> <mml:mtd> <mml:mrow> <mml:msub> <mml:mi> 年代</米米l:米我> <mml:mn> 2</米米l:米n> </mml:msub> <mml:mo stretchy="false"> (</米米l:米o> <mml:mi> t</米米l:米我> <mml:mo stretchy="false"> )</米米l:米o> </mml:mrow> </mml:mtd> </mml:mtr> <mml:mtr> <mml:mtd> <mml:mrow> <mml:msub> <mml:mi> 年代</米米l:米我> <mml:mn> 3</米米l:米n> </mml:msub> <mml:mo stretchy="false"> (</米米l:米o> <mml:mi> t</米米l:米我> <mml:mo stretchy="false"> )</米米l:米o> </mml:mrow> </mml:mtd> </mml:mtr> </mml:mtable> </mml:mrow> <mml:mo class="pmatrix"> )</米米l:米o> </mml:mrow> <mml:mn> ,</米米l:米n> </mml:mrow> </mml:math> </disp-formula>在哪里<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M195"> <mml:mrow> <mml:msub> <mml:mi> x</米米l:米我> <mml:mn> 1</米米l:米n> </mml:msub> <mml:mo stretchy="false"> (</米米l:米o> <mml:mi> t</米米l:米我> <mml:mo stretchy="false"> )</米米l:米o> </mml:mrow> </mml:math> </inline-formula>和<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M196"> <mml:mrow> <mml:msub> <mml:mi> x</米米l:米我> <mml:mn> 2</米米l:米n> </mml:msub> <mml:mo stretchy="false"> (</米米l:米o> <mml:mi> t</米米l:米我> <mml:mo stretchy="false"> )</米米l:米o> </mml:mrow> </mml:math> </inline-formula>左右通道立体声混合物和<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M197"> <mml:mrow> <mml:msub> <mml:mi> 年代</米米l:米我> <mml:mn> 1</米米l:米n> </mml:msub> <mml:mo stretchy="false"> (</米米l:米o> <mml:mi> t</米米l:米我> <mml:mo stretchy="false"> )</米米l:米o> </mml:mrow> </mml:math> </inline-formula>代表第一个单通道仪器信号等等。</pgydF4y2Ba> <p>谱图得到的混合物,使用短时傅里叶变换的损害窗口4096个样本,用hopsize帧之间的1024个样本。随机变量被初始化,除了SNTF-based频率基函数的分离,这是初始化与谐波基函数的频率最低的注意了每个工具在每一个例子。这样做是为了把平等SNTF SSNTF-based算法,每个源的音高最低的注意。最大许用笔记的数量设置为乐器的音高范围覆盖测试信号和谐波的数量用于SSNTF被设置为12。运行了300次迭代算法,分离源谱图被进行简约的张量乘法估计张片与一个单独的源。恢复源色再合成使用混合色的相位信息。阶段的通道在源是最强的立体混合的情况下使用。</pgydF4y2Ba> <p>使用原始信号作为参考,不同算法的性能进行评估使用常用的指标,即signal-to-distortion比率(SDR),它提供了一个总体衡量源分离的声音质量,信号干扰比(先生),措施的其他来源的分离的声音,和signal-to-artifacts比率(SAR),衡量工件中恢复信号分离和再合成。这些指标的详细信息可以在找到<xrgydF4y2Baef ref-type="bibr" rid="B52"> 52</xrgydF4y2Baef>)和一个Matlab工具箱来计算这些措施可以从[<xrgydF4y2Baef ref-type="bibr" rid="B53"> 53</xrgydF4y2Baef>]。如前所述<xrgydF4y2Baef ref-type="sec" rid="sec3"> 3</xrgydF4y2Baef>,提供最低音高注意每个源足以确定正确的源点的所有SSNTF-based算法。的SNTF-based算法,来源是由关联的顺序分离源与原源导致最好的爵士得分。这个匹配过程然后手动进行检查,以确保没有错误发生。</pgydF4y2Ba> <p>许多不同的测试来确定信号持续时间的影响算法的性能,并确定使用不同数量的允许变化的影响。测试信号的持续时间、混合信号截短长度的1,2,3,4秒的长度,时间变化的数量设置为5,和算法的性能评估。总结的结果如图所示<xrgydF4y2Baef ref-type="fig" rid="fig11"> 11</xrgydF4y2Baef>。的结果平均为每个源分离获得的指标给一个总体得分为每个测试混合物。每个混合物被平均产量的结果在图中所示的数据。可以看出SSNTF-based算法明显优于SNTF-based所有方法在所有情况下,尽管使用refiltering提高SNTF的性能。也可以看到信号持续时间没有多大影响的结果SSNTF,剩下的结果与信号持续时间相对稳定,表明SSNTF可以捕获谐波源即使在信号持续时间相对较短。</pgydF4y2Ba> <fig-group id="fig11"> <p>圆SNTF绩效评估(固体),再过滤SNTF(钻石固体),SSNTF(平方dash-dotted) source-filter SSNTF(三角形固体)和source-filter SSNTF(星冲)噪声基函数对各种信号的持续时间。</pgydF4y2Ba> <fig id="fig11a"> <label>(一)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.011a"></graphic> </fig> <fig id="fig11b"> <label>(b)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.011b"></graphic> </fig> <fig id="fig11c"> <label>(c)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.011c"></graphic> </fig> </fig-group> <p>在算法中加入源过滤性能改善与提高信号持续时间。先生这是特别明显的指标。这表明长信号持续时间为每个工具必须正确地捕捉过滤器。这是可以预料到的音符数增加了每个工具提供更多关于学习的信息过滤器,而谐波模型参数较少培训不需要尽可能多的信息。应该注意的是,这种趋势不太明显的音响比mono混合物,混合物表明来源在音响领域的空间定位可能影响学习能力源过滤器。这可能是测试通过测量在不同来源的分离混合系数,是一个地区未来的调查。尽管如此,可以看出在source-filter方法优于SSNTF更长时间,与基本source-filter模型执行更好的特别提款权和特别行政区,虽然source-filter +噪声方法性能更好的先生。</pgydF4y2Ba> <p>测试结果的时间变化的影响来源如图的分离<xrgydF4y2Baef ref-type="fig" rid="fig12"> 12</xrgydF4y2Baef>。这些都是使用相同的程序用于先前获得的测试。允许的数量变化范围从1到10,它对应于一个最大的转变时间约为0.2秒。再次,SSNTF-based算法明显优于SNTF-based方法,无论转变。然而,可以看出SSNTF和source-filter +噪声方法,性能相对稳定的数量允许变化,有一个小的性能提高到7班次和除此之外的性能略有降低。对于source-filter SSNTF,有一个明显的改善从一个两班倒的时候,除此之外,还有很少或没有性能的变化与增加数量的变化。调查,发现主要是明显的立体混合物,剩下mono混合物的性能相对稳定,再次强调了需要调查在不同混合算法的性能系数。总体而言,可以看出,算法的性能符合时,观察到不同信号持续时间,与source-filter加噪声的方法表现最好的先生,而source-filter SSNTF性能更好的特别提款权和特别行政区。进一步,研究结果表明,在许多情况下,一组谐波权重可以用来描述定位仪器不需要合并场音色改变随着时间的推移。</pgydF4y2Ba> <fig-group id="fig12"> <p>圆SNTF绩效评估(固体),再过滤SNTF(钻石固体),SSNTF(平方dash-dotted) Source-Filter SSNTF(三角形固体)和Source-Filter SSNTF(星冲)噪声基函数为各种容许时间的变化。</pgydF4y2Ba> <fig id="fig12a"> <label>(一)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.012a"></graphic> </fig> <fig id="fig12b"> <label>(b)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.012b"></graphic> </fig> <fig id="fig12c"> <label>(c)</lgydF4y2Baabel> <graphic xlink:href="//www.newsama.com/downloads/journals/cin/2008/872425.fig.012c"></graphic> </fig> </fig-group> <p>在听源分离,SSNTF-based方法明显优于SNTF。应该注意的是,在某些情况下,使用refiltering SNTF导致音频质量与SSNTF-based方法,然而这只是在少数的例子。在大多数情况下增加SSNTF source-filter改善的结果。在比较source-filter source-filter +噪声模型,方法是观察到的结果不同混合物混合,再合成的相当大的改进质量的来源和减少在其他情况下,在大量的测试结果可以听到没有重大差异。这表明,在许多情况下对清洁的混合信号定位仪器,没有必要将噪声基函数。然而,噪声基函数的使用仍然有用的噪音或打击乐器。还应该指出,在一半的测试混合物SNTF没有管理正确独立的来源,这与失真由于频率的拖尾箱由于从日志映射到线性频率,很好地解释了负特别提款权和爵士的分数。虽然SNTF使用refiltering导致改善的情况下,再合成来源得到了正确的分离,它也遭受底层SNTF技术的可靠性问题,这是所有指标反映在可怜的分数。这表明SSNTF-based技术比SNTF-based更健壮的技术。</p> <p>分离源通过一个加法合成的方法,也可以再合成和倾听,获得的结果与那些从spectrogram-based获得再合成。然而,随着添加剂合成方法使用不同阶段信息比spectrogram-based再合成,结果没有可比性使用本文中使用的度量。这凸显了需要开发一套perceptually-based声源分离和度量是一个为未来的研究领域。</pgydF4y2Ba> <p>还研究了模型的拟合优度原始谱图数据,以成本函数。这是观察到的结果SSNTF SNTF小于平均64%,尽管SSNTF较小数量的自由参数,随着谐波的数量远远小于频率垃圾箱用于恒定的数量<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M198"> <mml:mrow> <mml:mi> 问</米米l:米我> </mml:mrow> </mml:math> </inline-formula>SNTF声谱图。这突出了使用这种方法的好处仅仅制定的线性频域。使用source-filter SSNTF,额外的<我nl我ne-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M199"> <mml:mrow> <mml:mi> K</米米l:米我> <mml:mo> ×</米米l:米o> <mml:mi> n</米米l:米我> </mml:mrow> </mml:math> </inline-formula>在SSNTF参数,导致平均降低76%的成本函数SNTF相比,SSNTF相比,降低了33%。</pgydF4y2Ba> <p>总体上可以看出,本文提出的方法提供了一个相当大的改进使用SNTF先前的分离方法。大的改进中可以看到过去SNTF性能指标的方法,还可以看到,该模型导致一种改进的适合原始数据。</pgydF4y2Ba> </sec> <sec sec-type="section" id="sec7"> <title>7所示。结论</t我tle> <p>使用移不变的张量factorisations韵源分离的目的,特别强调定位仪器,讨论,与现有的算法问题突出。分组消息人士指出的问题是可以克服的,通过融合频率移不变性成factorisation框架,但代价就是需要使用对数频率表示。这造成相当大的问题,当试图resynthesise分离由于没有确切来源映射可供地图对数频率表示频率线性表示,导致相当大的退化的音质分离来源。虽然refiltering可以解决这个问题在某种程度上,再合成仍有问题。</pgydF4y2Ba> <p>也显示出另一个问题与现有的技术,特别是缺乏严格的谐波恢复频率基础上约束功能。以前曾试图对调和性使用一个特别的约束,没有谐波基函数零在地区活动预计。虽然这并保证不会有活动在这些地区,它并不保证基函数将一个正弦曲线的形状恢复如果出现在这些地区。</pgydF4y2Ba> <p>正弦转二维非负张量factorisation当时提出的同时克服这两个问题。它利用的一个封闭形式的解决方案存在计算已知频率的正弦信号的频谱,并使用一个加法合成的启发方法建模定位仪器,其中每个注意由乐器被建模为固定数量的加权之和在谐波正弦曲线关系。这些权重的改变被认为是不变的,所以每个音符是模仿使用相同的权重不管。个人的频谱谐波线性频域计算,消除任何时候需要使用对数频率表示的算法,和调和性约束是显式地使用字典谐波正弦信号的光谱信号。结果表明,使用这个信号模型结果适合原混合物光谱图比算法包含一个对数频率表示的使用,从而证明能够执行的好处仅仅在线性频域优化。</pgydF4y2Ba> <p>然而,应该指出的是,该模型也不是没有缺点。特别是,最好的结果,如果音高最低的注意每个搭仪器提供的算法。在大多数情况下,这些信息不容易获得,这需要使用标准的二维非负张量转移factorisation算法来估计这些球在使用正弦模型。研究目前正在进行的其他方法来克服这一问题,但尽管如此,它是觉得新算法的优点超过超过这个缺点。</pgydF4y2Ba> <p>使用相同的谐波权重或仪器基函数无论向现实世界只是一个近似情况下乐器的音色和音调变化。为了克服这个限制,source-filter模型整合到张量factorisation框架以前提出的。不幸的是,在声源分离的背景下,人们发现很难获得好的结果使用这种方法,有太多的参数优化。然而,严格的调和性约束提出了发现限制的范围足够使问题变得易于处理的解决方案。</pgydF4y2Ba> <p>此前发现的谐波限制被要求创建一个系统,可以同时处理音调和冲击的设备。但是,先前的尝试这种系统遭受由于使用对数频率表示,缺乏严格的谐波限制。这里介绍的组合模型扩展了此早期作品从单通道、多通道信号,克服了这些问题,使用正弦约束应用于线性频域,以及将源滤波器模型纳入系统,因此代表了一个更一般的模型比以前提出的。</pgydF4y2Ba> <p>在测试中使用常见的源分离性能指标,发现提出的扩展算法明显优于现有的张量factorisation算法,大大减少信号失真和工件的再合成。扩展的算法也比SNTF-based更可靠的方法。</pgydF4y2Ba> <p>总之,它已被证明,使用基于加法合成的方法建模工具在factorisation框架克服了问题与以前的方法,以及允许扩展现有的模型。未来的工作将集中在提出的改进模型,在提高通用性和改进分离来源的再合成,以及调查分离的混合系数的影响。也提出了调查的使用频域性能指标的增加源分离的知觉相关性度量。</pgydF4y2Ba> </sec> <back> <ack> <title>确认</t我tle> <p>这项研究是爱尔兰IMAAS项目由企业的一部分。作者要感谢米克尔Gainza,马修·哈特和丹·巴里对他们有用的讨论和评论在本文的准备。作者也要感谢那些评论家的有用的评论导致大大改善了纸。</pgydF4y2Ba> </ack> <ref-list> <ref id="B4" content-type="mastersthesis"> <label>1</lgydF4y2Baabel> <nlm-citation publication-type="thesis"> <person-group person-group-type="author"> <name> <surname> Stautner</年代urname> <given-names> j . P。</g我ven-names> </name> </person-group> <source> <italic> 使用听觉变换分析和合成的音乐</我talic>、硕士论文<gydF4y2Bayear> 1983年</gydF4y2Bayear> <publisher-loc> 美国马萨诸塞州剑桥市</pgydF4y2Baublisher-loc> <publisher-name> 麻省理工学院的电气工程和计算机科学系,麻省理工学院</pgydF4y2Baublisher-name> </nlm-citation> </ref> <ref id="B3" content-type="article"> <label>2</lgydF4y2Baabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 通常</年代urname> <given-names> P。</g我ven-names> </name> </person-group> <article-title> 独立分量分析,一个新概念?</gydF4y2Baarticle-title> <source> <italic> 信号处理</我talic> <year> 1994年</gydF4y2Bayear> <volume> 36</gydF4y2Bavolume> <issue> 3</我年代年代ue> <fpage> 287年</fpgydF4y2Baage> <lpage> 314年</lpgydF4y2Baage> <pub-id pub-id-type="doi"> 10.1016 / 0165 - 1684 (94)90029 - 9</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B5" content-type="article"> <label>3</lgydF4y2Baabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Lewicki</年代urname> <given-names> m . S。</g我ven-names> </name> <name> <surname> Sejnowski</年代urname> <given-names> t·J。</g我ven-names> </name> </person-group> <article-title> 学习overcomplete表示</gydF4y2Baarticle-title> <source> <italic> 神经计算</我talic> <year> 2000年</gydF4y2Bayear> <volume> 12</gydF4y2Bavolume> <issue> 2</我年代年代ue> <fpage> 337年</fpgydF4y2Baage> <lpage> 365年</lpgydF4y2Baage> <pub-id pub-id-type="doi"> 10.1162 / 089976600300015826</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B6" content-type="article"> <label>4</lgydF4y2Baabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Olshausen</年代urname> <given-names> b。</g我ven-names> </name> <aff> <email> baolshausen@ucdavis.edu</gydF4y2Baemail> </aff> <name> <surname> 场</年代urname> <given-names> d . J。</g我ven-names> </name> </person-group> <article-title> 稀疏编码的感官输入</gydF4y2Baarticle-title> <source> <italic> 目前在神经生物学的观点</我talic> <year> 2004年</gydF4y2Bayear> <volume> 14</gydF4y2Bavolume> <issue> 4</我年代年代ue> <fpage> 481年</fpgydF4y2Baage> <lpage> 487年</lpgydF4y2Baage> <pub-id pub-id-type="doi"> 10.1016 / j.conb.2004.07.007</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B39" content-type="article"> <label>5</lgydF4y2Baabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 李</年代urname> <given-names> D。</g我ven-names> </name> <name> <surname> Seung</年代urname> <given-names> H。</g我ven-names> </name> </person-group> <article-title> 学习对象的部分非负矩阵factorisation</gydF4y2Baarticle-title> <source> <italic> 自然</我talic> <year> 1999年</gydF4y2Bayear> <volume> 401年</gydF4y2Bavolume> <issue> 6755年</我年代年代ue> <fpage> 788年</fpgydF4y2Baage> <lpage> 791年</lpgydF4y2Baage> <pub-id pub-id-type="doi"> 10.1038/44565</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B40" content-type="article"> <label>6</lgydF4y2Baabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Paatero</年代urname> <given-names> P。</g我ven-names> </name> <name> <surname> 攻丝机</年代urname> <given-names> U。</g我ven-names> </name> </person-group> <article-title> 积极的矩阵分解:一个非负因子模型误差估计的优化利用的数据值</gydF4y2Baarticle-title> <source> <italic> Environmetrics</我talic> <year> 1994年</gydF4y2Bayear> <volume> 5</gydF4y2Bavolume> <issue> 2</我年代年代ue> <fpage> 111年</fpgydF4y2Baage> <lpage> 126年</lpgydF4y2Baage> <pub-id pub-id-type="doi"> 10.1002 / env.3170050203</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B42" content-type="inproceedings"> <label>7</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> 凯西</年代urname> <given-names> M。</g我ven-names> </name> <name> <surname> Westner</年代urname> <given-names> 一个。</g我ven-names> </name> </person-group> <article-title> 分离混合音频来源由独立子空间分析</gydF4y2Baarticle-title> <conf-name> 国际计算机音乐研讨会论文集(ICMC ' 00)</cgydF4y2Baonf-name> <conf-date> August-September 2000</cgydF4y2Baonf-date> <conf-loc> 柏林,德国</cgydF4y2Baonf-loc> <fpage> 154年</fpgydF4y2Baage> <lpage> 161年</lpgydF4y2Baage> </nlm-citation> </ref> <ref id="B43" content-type="inproceedings"> <label>8</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> 维尔塔宁</年代urname> <given-names> T。</g我ven-names> </name> </person-group> <article-title> 声源分离使用稀疏编码和时间连续性的目标</gydF4y2Baarticle-title> <conf-name> 国际计算机音乐研讨会论文集(ICMC ' 03)</cgydF4y2Baonf-name> <conf-date> 2003年9月</cgydF4y2Baonf-date> <conf-loc> 新加坡</cgydF4y2Baonf-loc> <fpage> 231年</fpgydF4y2Baage> <lpage> 234年</lpgydF4y2Baage> </nlm-citation> </ref> <ref id="B44" content-type="inproceedings"> <label>9</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> Smaragdis</年代urname> <given-names> P。</g我ven-names> </name> <name> <surname> 布朗</年代urname> <given-names> j . C。</g我ven-names> </name> </person-group> <article-title> 非负矩阵分解为复调音乐转录</gydF4y2Baarticle-title> <conf-name> 《IEEE音频和声学信号处理应用的研讨会上发表(WASPAA ' 03)</cgydF4y2Baonf-name> <conf-date> 2003年10月</cgydF4y2Baonf-date> <conf-loc> 美国纽约(纽柏兹</cgydF4y2Baonf-loc> <fpage> 177年</fpgydF4y2Baage> <lpage> 180年</lpgydF4y2Baage> </nlm-citation> </ref> <ref id="B22" content-type="inproceedings"> <label>10</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> 菲茨杰拉德</年代urname> <given-names> D。</g我ven-names> </name> <name> <surname> 软件的</年代urname> <given-names> B。</g我ven-names> </name> <name> <surname> Coyle</年代urname> <given-names> E。</g我ven-names> </name> </person-group> <article-title> 可独立子空间分析鼓转录</gydF4y2Baarticle-title> <conf-name> 学报》第五届国际会议上数字音频效果(DAFX ' 02)</cgydF4y2Baonf-name> <conf-date> 2002年9月</cgydF4y2Baonf-date> <conf-loc> 德国汉堡</cgydF4y2Baonf-loc> <fpage> 65年</fpgydF4y2Baage> <lpage> 69年</lpgydF4y2Baage> </nlm-citation> </ref> <ref id="B25" content-type="inproceedings"> <label>11</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> 康特</年代urname> <given-names> 年代。</g我ven-names> </name> <name> <surname> 小野</年代urname> <given-names> N。</g我ven-names> </name> <name> <surname> Sagayama</年代urname> <given-names> 年代。</g我ven-names> </name> </person-group> <article-title> Multipitch分析谐波非负矩阵近似</gydF4y2Baarticle-title> <conf-name> 《第八届国际会议上音乐信息检索(ISMIR ' 07)</cgydF4y2Baonf-name> <conf-date> 2007年9月</cgydF4y2Baonf-date> <conf-loc> 奥地利的维也纳</cgydF4y2Baonf-loc> <fpage> 381年</fpgydF4y2Baage> <lpage> 386年</lpgydF4y2Baage> </nlm-citation> </ref> <ref id="B2" content-type="inproceedings"> <label>12</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> Sajda</年代urname> <given-names> P。</g我ven-names> </name> <name> <surname> 杜</年代urname> <given-names> 年代。</g我ven-names> </name> <name> <surname> Parra</年代urname> <given-names> l</g我ven-names> </name> </person-group> <article-title> 恢复使用非负矩阵分解成分光谱</gydF4y2Baarticle-title> <volume> 5207年</gydF4y2Bavolume> <conf-name> 小波:应用于信号和图像处理X</cgydF4y2Baonf-name> <conf-date> 2003年8月</cgydF4y2Baonf-date> <conf-loc> 圣地亚哥,加州,美国</cgydF4y2Baonf-loc> <fpage> 321年</fpgydF4y2Baage> <lpage> 331年</lpgydF4y2Baage> <series> 学报学报</年代eries> <pub-id pub-id-type="doi"> 10.1117/12.504676</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B1" content-type="phdthesis"> <label>13</lgydF4y2Baabel> <nlm-citation publication-type="thesis"> <person-group person-group-type="author"> <name> <surname> 维尔塔宁</年代urname> <given-names> T。</g我ven-names> </name> </person-group> <source> <italic> 声源在单耳的音乐信号分离</我talic>,博士学位论文<gydF4y2Bayear> 2006年</gydF4y2Bayear> <publisher-loc> 坦佩雷,芬兰</pgydF4y2Baublisher-loc> <publisher-name> 坦佩雷理工大学</pgydF4y2Baublisher-name> </nlm-citation> </ref> <ref id="B34" content-type="inproceedings"> <label>14</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> 菲茨杰拉德</年代urname> <given-names> D。</g我ven-names> </name> <name> <surname> Cranitch</年代urname> <given-names> M。</g我ven-names> </name> <name> <surname> Coyle</年代urname> <given-names> E。</g我ven-names> </name> </person-group> <article-title> 将非负矩阵factorisation声源分离</gydF4y2Baarticle-title> <conf-name> 学报13 IEEE / SP车间统计信号处理</cgydF4y2Baonf-name> <conf-date> 2005年7月</cgydF4y2Baonf-date> <conf-loc> 法国波尔多葡萄酒</cgydF4y2Baonf-loc> <fpage> 1132年</fpgydF4y2Baage> <lpage> 1137年</lpgydF4y2Baage> <pub-id pub-id-type="doi"> 10.1109 / SSP.2005.1628765</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B10" content-type="unpublished"> <label>15</lgydF4y2Baabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Mørup</年代urname> <given-names> M。</g我ven-names> </name> <name> <surname> 汉森</年代urname> <given-names> l·K。</g我ven-names> </name> <name> <surname> Arnfred</年代urname> <given-names> s M。</g我ven-names> </name> </person-group> <article-title> 稀疏的高阶非负矩阵因子分解</gydF4y2Baarticle-title> <comment> <italic> 技术报告imm2007 - 04658,丹麦技术大学</我talic> </comment> </nlm-citation> </ref> <ref id="B38" content-type="inproceedings"> <label>16</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> 阿卜杜拉</年代urname> <given-names> 美国一个。</g我ven-names> </name> <name> <surname> Plumbley</年代urname> <given-names> m D。</g我ven-names> </name> </person-group> <article-title> 复调的非负稀疏编码转录谱</gydF4y2Baarticle-title> <conf-name> 第五届国际会议上学报》音乐信息检索(ISMIR ' 04)</cgydF4y2Baonf-name> <conf-date> 2004年10月</cgydF4y2Baonf-date> <conf-loc> 西班牙巴塞罗那</cgydF4y2Baonf-loc> <fpage> 318年</fpgydF4y2Baage> <lpage> 325年</lpgydF4y2Baage> </nlm-citation> </ref> <ref id="B11" content-type="inproceedings"> <label>17</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> 帕里</年代urname> <given-names> r·M。</g我ven-names> </name> <name> <surname> 艾萨</年代urname> <given-names> 我。</g我ven-names> </name> </person-group> <article-title> 通过谱图分解合并源分离的相位信息</gydF4y2Baarticle-title> <volume> 2</gydF4y2Bavolume> <conf-name> 《IEEE国际会议音响、演讲和信号处理(ICASSP ' 07)</cgydF4y2Baonf-name> <conf-date> 2007年4月</cgydF4y2Baonf-date> <conf-loc> 美国夏威夷火奴鲁鲁</cgydF4y2Baonf-loc> <fpage> 661年</fpgydF4y2Baage> <lpage> 664年</lpgydF4y2Baage> <pub-id pub-id-type="doi"> 10.1109 / ICASSP.2007.366322</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B12" content-type="inproceedings"> <label>18</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> 帕里</年代urname> <given-names> r·M。</g我ven-names> </name> <aff> <email> parry@cc.gatech.edu</gydF4y2Baemail> </aff> <name> <surname> 艾萨</年代urname> <given-names> 我。</g我ven-names> </name> <aff> <email> irfan@cc.gatech.edu</gydF4y2Baemail> </aff> </person-group> <article-title> Phase-aware非负谱图分解</gydF4y2Baarticle-title> <volume> 4666年</gydF4y2Bavolume> <conf-name> 第七届国际会议的程序独立分量分析(ICA ' 07)和信号分离</cgydF4y2Baonf-name> <conf-date> 2007年9月</cgydF4y2Baonf-date> <conf-loc> 英国伦敦</cgydF4y2Baonf-loc> <fpage> 536年</fpgydF4y2Baage> <lpage> 543年</lpgydF4y2Baage> <series> 在计算机科学的课堂讲稿</年代eries> <pub-id pub-id-type="doi"> 10.1007 / 978 - 3 - 540 - 74494 - 8 - _67</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B13" content-type="inproceedings"> <label>19</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> 康帕斯</年代urname> <given-names> R。</g我ven-names> </name> <aff> <email> kompass@inf.fu-berlin.de</gydF4y2Baemail> </aff> </person-group> <article-title> 非负矩阵分解的广义散度测量</gydF4y2Baarticle-title> <conf-name> 《Neuroinformatics车间</cgydF4y2Baonf-name> <conf-date> 2005年9月</cgydF4y2Baonf-date> <conf-loc> 波兰托伦</cgydF4y2Baonf-loc> </nlm-citation> </ref> <ref id="B14" content-type="inproceedings"> <label>20.</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> Cichocki</年代urname> <given-names> 一个。</g我ven-names> </name> <name> <surname> Zdunek</年代urname> <given-names> R。</g我ven-names> </name> <name> <surname> Amari</年代urname> <given-names> 机票的。</g我ven-names> </name> </person-group> <article-title> Csiszar差异的非负矩阵分解:家庭的新算法</gydF4y2Baarticle-title> <volume> 3889年</gydF4y2Bavolume> <conf-name> 学报第六届国际会议上独立分量分析和盲信号分离(ICA 06年)</cgydF4y2Baonf-name> <conf-date> 2006年3月</cgydF4y2Baonf-date> <conf-loc> 查尔斯顿美国SC</cgydF4y2Baonf-loc> <publisher-name> 施普林格</pgydF4y2Baublisher-name> <fpage> 32</fpgydF4y2Baage> <lpage> 39</lpgydF4y2Baage> <series> 在计算机科学的课堂讲稿</年代eries> <pub-id pub-id-type="doi"> 10.1007 / 11679363 _5</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B15" content-type="phdthesis"> <label>21</lgydF4y2Baabel> <nlm-citation publication-type="thesis"> <person-group person-group-type="author"> <name> <surname> 格雷迪</年代urname> <given-names> p . d . O。</g我ven-names> </name> </person-group> <source> <italic> 稀疏的言论我要说混合物的分离</我talic>,博士学位论文<gydF4y2Bayear> 2007年</gydF4y2Bayear> <publisher-loc> 基尔代尔、爱尔兰</pgydF4y2Baublisher-loc> <publisher-name> 爱尔兰国立大学的埃里克</pgydF4y2Baublisher-name> </nlm-citation> </ref> <ref id="B41" content-type="phdthesis"> <label>22</lgydF4y2Baabel> <nlm-citation publication-type="thesis"> <person-group person-group-type="author"> <name> <surname> 菲茨杰拉德</年代urname> <given-names> D。</g我ven-names> </name> </person-group> <source> <italic> 自动鼓转录和源分离</我talic>,博士学位论文<gydF4y2Bayear> 2004年</gydF4y2Bayear> <publisher-loc> 爱尔兰都柏林</pgydF4y2Baublisher-loc> <publisher-name> 都柏林理工学院</pgydF4y2Baublisher-name> </nlm-citation> </ref> <ref id="B46" content-type="article"> <label>23</lgydF4y2Baabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 贝德</年代urname> <given-names> b·W。</g我ven-names> </name> <aff> <email> bwbader@sandia.gov</gydF4y2Baemail> </aff> <name> <surname> Kolda</年代urname> <given-names> t·G。</g我ven-names> </name> <aff> <email> tgkolda@sandia.gov</gydF4y2Baemail> </aff> </person-group> <article-title> 862年算法:MATLAB张量类原型的快速算法</gydF4y2Baarticle-title> <source> <italic> ACM交易的数学软件</我talic> <year> 2006年</gydF4y2Bayear> <volume> 32</gydF4y2Bavolume> <issue> 4</我年代年代ue> <fpage> 635年</fpgydF4y2Baage> <lpage> 653年</lpgydF4y2Baage> <pub-id pub-id-type="doi"> 10.1145/1186785.1186794</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B35" content-type="inproceedings"> <label>24</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> 菲茨杰拉德</年代urname> <given-names> D。</g我ven-names> </name> <aff> <email> derry.fitzgerald@cit.ie</gydF4y2Baemail> </aff> <name> <surname> Cranitch</年代urname> <given-names> M。</g我ven-names> </name> <name> <surname> Coyle</年代urname> <given-names> E。</g我ven-names> </name> <aff> <email> eugene.coyle@dit.ie</gydF4y2Baemail> </aff> </person-group> <article-title> 非负张量factorisation声源分离</gydF4y2Baarticle-title> <conf-name> 《爱尔兰信号与系统会议</cgydF4y2Baonf-name> <conf-date> 2005年9月</cgydF4y2Baonf-date> <conf-loc> 爱尔兰都柏林</cgydF4y2Baonf-loc> <fpage> 8</fpgydF4y2Baage> <lpage> 12</lpgydF4y2Baage> </nlm-citation> </ref> <ref id="B16" content-type="inproceedings"> <label>25</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> 帕里</年代urname> <given-names> r·M。</g我ven-names> </name> <aff> <email> parry@cc.gatech.edu</gydF4y2Baemail> </aff> <name> <surname> 艾萨</年代urname> <given-names> 我。</g我ven-names> </name> <aff> <email> irfan@cc.gatech.edu</gydF4y2Baemail> </aff> </person-group> <article-title> 估计在音频频谱的空间位置组件</gydF4y2Baarticle-title> <volume> 3889年</gydF4y2Bavolume> <conf-name> 学报第六届国际会议上独立分量分析和盲信号分离(ICA 06年)</cgydF4y2Baonf-name> <conf-date> 2006年3月</cgydF4y2Baonf-date> <conf-loc> 查尔斯顿美国SC</cgydF4y2Baonf-loc> <fpage> 666年</fpgydF4y2Baage> <lpage> 673年</lpgydF4y2Baage> <series> 在计算机科学的课堂讲稿</年代eries> <pub-id pub-id-type="doi"> 10.1007 / 11679363 _83</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B50" content-type="inproceedings"> <label>26</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> 巴里</年代urname> <given-names> D。</g我ven-names> </name> <name> <surname> 软件的</年代urname> <given-names> B。</g我ven-names> </name> <name> <surname> Coyle</年代urname> <given-names> E。</g我ven-names> </name> </person-group> <article-title> 声源分离:方位歧视和再合成</gydF4y2Baarticle-title> <conf-name> 学报》第七届国际会议上数字音频效果(DAFX ' 04)</cgydF4y2Baonf-name> <conf-date> 2004年10月</cgydF4y2Baonf-date> <conf-loc> 那不勒斯,意大利</cgydF4y2Baonf-loc> </nlm-citation> </ref> <ref id="B18" content-type="inproceedings"> <label>27</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> Smaragdis</年代urname> <given-names> P。</g我ven-names> </name> <aff> <email> paris@merl.com</gydF4y2Baemail> </aff> </person-group> <article-title> 非负矩阵因子反褶积;从单声道输入提取多个声音来源</gydF4y2Baarticle-title> <volume> 3195年</gydF4y2Bavolume> <conf-name> 学报》第五届国际会议上独立分量分析和盲信号分离</cgydF4y2Baonf-name> <conf-date> 2004年9月</cgydF4y2Baonf-date> <conf-loc> 格林纳达、西班牙</cgydF4y2Baonf-loc> <fpage> 494年</fpgydF4y2Baage> <lpage> 499年</lpgydF4y2Baage> <series> 在计算机科学的课堂讲稿</年代eries> <pub-id pub-id-type="doi"> 10.1007 / b100528</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B17" content-type="inproceedings"> <label>28</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> 维尔塔宁</年代urname> <given-names> T。</g我ven-names> </name> </person-group> <article-title> 分离的声音来源convolutive稀疏编码</gydF4y2Baarticle-title> <conf-name> 学报ISCA教程和研究统计研讨会和感知音频处理(SAPA 04年)</cgydF4y2Baonf-name> <conf-date> 2004年10月</cgydF4y2Baonf-date> <conf-loc> 济州岛,韩国</cgydF4y2Baonf-loc> </nlm-citation> </ref> <ref id="B7" content-type="inproceedings"> <label>29日</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> 施密特</年代urname> <given-names> m . N。</g我ven-names> </name> <aff> <email> mns@imm.dtu.dk</gydF4y2Baemail> </aff> <name> <surname> Mørup</年代urname> <given-names> M。</g我ven-names> </name> <aff> <email> mm@imm.dtu.dk</gydF4y2Baemail> </aff> </person-group> <article-title> 非负矩阵因子二维反褶积盲人单通道源分离</gydF4y2Baarticle-title> <volume> 3889年</gydF4y2Bavolume> <conf-name> 学报第六届国际会议上独立分量分析和盲信号分离(ICA 06年)</cgydF4y2Baonf-name> <conf-date> 2006年3月</cgydF4y2Baonf-date> <conf-loc> 查尔斯顿美国SC</cgydF4y2Baonf-loc> <fpage> 700年</fpgydF4y2Baage> <lpage> 707年</lpgydF4y2Baage> <series> 在计算机科学的课堂讲稿</年代eries> <pub-id pub-id-type="doi"> 10.1007 / 11679363 _87</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B45" content-type="inproceedings"> <label>30.</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> 文森特</年代urname> <given-names> E。</g我ven-names> </name> <aff> <email> emmanuel.vincent@ircam.fr</gydF4y2Baemail> </aff> <name> <surname> Rodet</年代urname> <given-names> X。</g我ven-names> </name> </person-group> <article-title> 音乐与ISA转录和嗯</gydF4y2Baarticle-title> <volume> 3195年</gydF4y2Bavolume> <conf-name> 学报》第五届国际会议上独立分量分析和盲信号分离(ICA的04)</cgydF4y2Baonf-name> <conf-date> 2004年9月</cgydF4y2Baonf-date> <conf-loc> 格拉纳达,西班牙</cgydF4y2Baonf-loc> <fpage> 1197年</fpgydF4y2Baage> <lpage> 1204年</lpgydF4y2Baage> <series> 在计算机科学的课堂讲稿</年代eries> <pub-id pub-id-type="doi"> 10.1007 / b100528</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B8" content-type="inproceedings"> <label>31日</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> 尼尔森</年代urname> <given-names> 答:B。</g我ven-names> </name> <aff> <email> abn@imm.dtu.dk</gydF4y2Baemail> </aff> <name> <surname> Sigurdsson</年代urname> <given-names> 年代。</g我ven-names> </name> <aff> <email> siggi@imm.dtu.dk</gydF4y2Baemail> </aff> <name> <surname> 汉森</年代urname> <given-names> l·K。</g我ven-names> </name> <aff> <email> lkh@imm.dtu.dk</gydF4y2Baemail> </aff> <name> <surname> Arenas-Garcia</年代urname> <given-names> J。</g我ven-names> </name> <aff> <email> jag@imm.dtu.dk</gydF4y2Baemail> </aff> </person-group> <article-title> 光谱特性的相关性乐器分类</gydF4y2Baarticle-title> <volume> 2</gydF4y2Bavolume> <conf-name> 《IEEE国际会议音响、演讲和信号处理(ICASSP ' 07)</cgydF4y2Baonf-name> <conf-date> 2007年4月</cgydF4y2Baonf-date> <conf-loc> 美国夏威夷火奴鲁鲁</cgydF4y2Baonf-loc> <fpage> 485年</fpgydF4y2Baage> <lpage> 488年</lpgydF4y2Baage> <pub-id pub-id-type="doi"> 10.1109 / ICASSP.2007.366278</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B33" content-type="article"> <label>32</lgydF4y2Baabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 布朗</年代urname> <given-names> j . C。</g我ven-names> </name> </person-group> <article-title> 一个常数计算Q谱变换</gydF4y2Baarticle-title> <source> <italic> 美国声学学会杂志》上</我talic> <year> 1991年</gydF4y2Bayear> <volume> 89年</gydF4y2Bavolume> <issue> 1</我年代年代ue> <fpage> 425年</fpgydF4y2Baage> <lpage> 434年</lpgydF4y2Baage> <pub-id pub-id-type="doi"> 10.1121/1.400476</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B9" content-type="inproceedings"> <label>33</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> 艾格特</年代urname> <given-names> J。</g我ven-names> </name> <name> <surname> 的问题</年代urname> <given-names> H。</g我ven-names> </name> <name> <surname> Korner</年代urname> <given-names> E。</g我ven-names> </name> </person-group> <article-title> Transformation-invariant表示和NMF</gydF4y2Baarticle-title> <volume> 4</gydF4y2Bavolume> <conf-name> 《IEEE国际联合会议上神经网络(IJCNN ' 04)</cgydF4y2Baonf-name> <conf-date> 2004年7月</cgydF4y2Baonf-date> <conf-loc> 匈牙利布达佩斯</cgydF4y2Baonf-loc> <fpage> 2535年</fpgydF4y2Baage> <lpage> 2539年</lpgydF4y2Baage> <pub-id pub-id-type="doi"> 10.1109 / IJCNN.2004.1381038</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B37" content-type="inproceedings"> <label>34</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> 菲茨杰拉德</年代urname> <given-names> D。</g我ven-names> </name> <name> <surname> Cranitch</年代urname> <given-names> M。</g我ven-names> </name> <name> <surname> Coyle</年代urname> <given-names> E。</g我ven-names> </name> </person-group> <article-title> 二维非负张量factorisation转移</gydF4y2Baarticle-title> <conf-name> 《爱尔兰信号与系统会议</cgydF4y2Baonf-name> <conf-date> 2006年6月</cgydF4y2Baonf-date> <conf-loc> 爱尔兰都柏林</cgydF4y2Baonf-loc> <fpage> 509年</fpgydF4y2Baage> <lpage> 513年</lpgydF4y2Baage> </nlm-citation> </ref> <ref id="B19" content-type="techreport"> <label>35</lgydF4y2Baabel> <nlm-citation publication-type="gov"> <person-group person-group-type="author"> <name> <surname> Mørup</年代urname> <given-names> M。</g我ven-names> </name> <name> <surname> 施密特</年代urname> <given-names> m . N。</g我ven-names> </name> </person-group> <article-title> 稀疏非负张量2 d反褶积(SNTF2D)多信道的时频分析</gydF4y2Baarticle-title> <year> 2006年</gydF4y2Bayear> <publisher-loc> 丹麦哥本哈根</pgydF4y2Baublisher-loc> <publisher-name> 丹麦技术大学</pgydF4y2Baublisher-name> </nlm-citation> </ref> <ref id="B36" content-type="inproceedings"> <label>36</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> 菲茨杰拉德</年代urname> <given-names> D。</g我ven-names> </name> <aff> <email> derry.fitzgerald@cit.ie</gydF4y2Baemail> </aff> <name> <surname> Cranitch</年代urname> <given-names> M。</g我ven-names> </name> <name> <surname> Coyle</年代urname> <given-names> E。</g我ven-names> </name> <aff> <email> eugene.coyle@dit.ie</gydF4y2Baemail> </aff> </person-group> <article-title> 使用转移非负张量factorisation声源分离</gydF4y2Baarticle-title> <volume> 5</gydF4y2Bavolume> <conf-name> 《IEEE国际会议音响、演讲和信号处理(ICASSP 06年)</cgydF4y2Baonf-name> <conf-date> 2006年5月</cgydF4y2Baonf-date> <conf-loc> 图卢兹,法国</cgydF4y2Baonf-loc> <fpage> 653年</fpgydF4y2Baage> <lpage> 656年</lpgydF4y2Baage> <pub-id pub-id-type="doi"> 10.1109 / ICASSP.2006.1661360</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B24" content-type="incollection"> <label>37</lgydF4y2Baabel> <nlm-citation publication-type="book"> <person-group person-group-type="author"> <name> <surname> Slaney</年代urname> <given-names> M。</g我ven-names> </name> </person-group> <article-title> 回放模式在90年代</gydF4y2Baarticle-title> <source> <italic> 先进的神经信息处理系统7</我talic> <year> 1996年</gydF4y2Bayear> <publisher-loc> 美国马萨诸塞州剑桥市</pgydF4y2Baublisher-loc> <publisher-name> 麻省理工学院出版社</pgydF4y2Baublisher-name> </nlm-citation> </ref> <ref id="B21" content-type="inproceedings"> <label>38</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> 菲茨杰拉德</年代urname> <given-names> D。</g我ven-names> </name> <name> <surname> Cranitch</年代urname> <given-names> M。</g我ven-names> </name> <name> <surname> Coyle</年代urname> <given-names> E。</g我ven-names> </name> </person-group> <article-title> 再合成方法使用非负factorisation声源分离的方法</gydF4y2Baarticle-title> <conf-name> 《爱尔兰信号与系统会议</cgydF4y2Baonf-name> <conf-date> 2007年9月</cgydF4y2Baonf-date> <conf-loc> 德里、爱尔兰</cgydF4y2Baonf-loc> </nlm-citation> </ref> <ref id="B23" content-type="inproceedings"> <label>39</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> 菲茨杰拉德</年代urname> <given-names> D。</g我ven-names> </name> <name> <surname> Cranitch</年代urname> <given-names> M。</g我ven-names> </name> <name> <surname> Cychowski</年代urname> <given-names> M。</g我ven-names> </name> </person-group> <article-title> 对一个逆常数Q变换</gydF4y2Baarticle-title> <conf-name> 学报120 AES公约</cgydF4y2Baonf-name> <conf-date> 2006年5月</cgydF4y2Baonf-date> <conf-loc> 法国巴黎</cgydF4y2Baonf-loc> </nlm-citation> </ref> <ref id="B20" content-type="inproceedings"> <label>40</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> 施密特</年代urname> <given-names> m . N。</g我ven-names> </name> <aff> <email> mns@imm.dtu.dk</gydF4y2Baemail> </aff> <name> <surname> Mørup</年代urname> <given-names> M。</g我ven-names> </name> <aff> <email> mm@imm.dtu.dk</gydF4y2Baemail> </aff> </person-group> <article-title> 非负矩阵因子二维反褶积盲人单通道源分离</gydF4y2Baarticle-title> <volume> 3889年</gydF4y2Bavolume> <conf-name> 学报第六届国际会议上独立分量分析和盲信号分离(ICA 06年)</cgydF4y2Baonf-name> <conf-date> 2006年3月</cgydF4y2Baonf-date> <conf-loc> 查尔斯顿美国SC</cgydF4y2Baonf-loc> <fpage> 700年</fpgydF4y2Baage> <lpage> 707年</lpgydF4y2Baage> <series> 在计算机科学的课堂讲稿</年代eries> <pub-id pub-id-type="doi"> 10.1007 / 11679363 _87</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B27" content-type="book"> <label>41</lgydF4y2Baabel> <nlm-citation publication-type="book"> <person-group person-group-type="author"> <name> <surname> DeFatta</年代urname> <given-names> D。</g我ven-names> </name> <name> <surname> 卢卡斯</年代urname> <given-names> J。</g我ven-names> </name> <name> <surname> Hodgkiss</年代urname> <given-names> W。</g我ven-names> </name> </person-group> <source> <italic> 数字信号处理:系统设计方法</我talic> <year> 1988年</gydF4y2Bayear> <publisher-loc> 纽约,纽约,美国</pgydF4y2Baublisher-loc> <publisher-name> 约翰威利& Sons</pgydF4y2Baublisher-name> </nlm-citation> </ref> <ref id="B26" content-type="inproceedings"> <label>42</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> 释放</年代urname> <given-names> 一个。</g我ven-names> </name> <name> <surname> Rodet</年代urname> <given-names> X。</g我ven-names> </name> <name> <surname> Depalle</年代urname> <given-names> P。</g我ven-names> </name> </person-group> <article-title> 加法合成的性能、合成和控制使用FFT-1台式电脑</gydF4y2Baarticle-title> <volume> 19</gydF4y2Bavolume> <conf-name> 19国际计算机音乐研讨会论文集(ICMC ' 93)</cgydF4y2Baonf-name> <conf-date> 1993年9月</cgydF4y2Baonf-date> <conf-loc> 日本东京</cgydF4y2Baonf-loc> <publisher-name> 早稻田大学学术信息中心、国际计算机音乐协会</pgydF4y2Baublisher-name> <fpage> 98年</fpgydF4y2Baage> <lpage> 101年</lpgydF4y2Baage> </nlm-citation> </ref> <ref id="B28" content-type="book"> <label>43</lgydF4y2Baabel> <nlm-citation publication-type="book"> <person-group person-group-type="author"> <name> <surname> 弗莱彻</年代urname> <given-names> n . F。</g我ven-names> </name> <name> <surname> 罗欣</年代urname> <given-names> t D。</g我ven-names> </name> </person-group> <source> <italic> 乐器的物理</我talic> <year> 1998年</gydF4y2Bayear> <edition> 2日</gydF4y2Baedition> <publisher-loc> 纽约,纽约,美国</pgydF4y2Baublisher-loc> <publisher-name> 施普林格</pgydF4y2Baublisher-name> </nlm-citation> </ref> <ref id="B47" content-type="misc"> <label>44</lgydF4y2Baabel> <nlm-citation publication-type="other"> <comment> 张量为Matlab工具箱,<gydF4y2Baext-link ext-link-type="url" xlink:href="http://csmr.ca.sandia.gov/~tgkolda/TensorToolbox/"> http://csmr.ca.sandia.gov/ tgkolda / TensorToolbox /</gydF4y2Baext-link> </comment> </nlm-citation> </ref> <ref id="B29" content-type="inproceedings"> <label>45</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> 伍德乐夫</年代urname> <given-names> J。</g我ven-names> </name> <name> <surname> 帕尔多</年代urname> <given-names> B。</g我ven-names> </name> <name> <surname> 丹嫩贝格</年代urname> <given-names> R。</g我ven-names> </name> </person-group> <article-title> 再混合立体声音乐score-informed源分离</gydF4y2Baarticle-title> <conf-name> 第七届国际研讨会学报》音乐信息检索(ISMIR 06年)</cgydF4y2Baonf-name> <conf-date> 2006年10月</cgydF4y2Baonf-date> <conf-loc> 加拿大维多利亚</cgydF4y2Baonf-loc> </nlm-citation> </ref> <ref id="B30" content-type="inproceedings"> <label>46</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> 维尔塔宁</年代urname> <given-names> T。</g我ven-names> </name> <name> <surname> Klapuri</年代urname> <given-names> 一个。</g我ven-names> </name> </person-group> <article-title> 分析复调音频使用source-filter模型和非负矩阵因子分解</gydF4y2Baarticle-title> <conf-name> 学报的发展模型进行声学处理,车间神经信息处理系统</cgydF4y2Baonf-name> <conf-date> 2006年12月</cgydF4y2Baonf-date> <conf-loc> 惠斯勒,加拿大</cgydF4y2Baonf-loc> </nlm-citation> </ref> <ref id="B31" content-type="article"> <label>47</lgydF4y2Baabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Valimaki</年代urname> <given-names> V。</g我ven-names> </name> <aff> <email> Vesa.Valimaki@tkk.fi</gydF4y2Baemail> </aff> <name> <surname> Pakarinen</年代urname> <given-names> J。</g我ven-names> </name> <name> <surname> Erkut</年代urname> <given-names> C。</g我ven-names> </name> <name> <surname> Karjalainen</年代urname> <given-names> M。</g我ven-names> </name> </person-group> <article-title> 离散时间模型的乐器</gydF4y2Baarticle-title> <source> <italic> 物理学进展报告</我talic> <year> 2006年</gydF4y2Bayear> <volume> 69年</gydF4y2Bavolume> <issue> 1</我年代年代ue> <fpage> 1</fpgydF4y2Baage> <lpage> 78年</lpgydF4y2Baage> <pub-id pub-id-type="doi"> 10.1088 / 0034 - 4885/69/1 / R01基金</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B32" content-type="inproceedings"> <label>48</lgydF4y2Baabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> 施罗德</年代urname> <given-names> m·R。</g我ven-names> </name> <name> <surname> 阿塔尔•</年代urname> <given-names> b S。</g我ven-names> </name> </person-group> <article-title> Code-excited线性预测(CELP):高质量的演讲非常低的比特率</gydF4y2Baarticle-title> <volume> 10</gydF4y2Bavolume> <conf-name> IEEE国际会议上声学学报》,演讲,和信号处理(ICASSP ' 85)</cgydF4y2Baonf-name> <conf-date> 1985年4月</cgydF4y2Baonf-date> <conf-loc> 美国佛罗里达州坦帕</cgydF4y2Baonf-loc> <fpage> 937年</fpgydF4y2Baage> <lpage> 940年</lpgydF4y2Baage> </nlm-citation> </ref> <ref id="B49" content-type="incollection"> <label>49</lgydF4y2Baabel> <nlm-citation publication-type="book"> <person-group person-group-type="author"> <name> <surname> 塞拉</年代urname> <given-names> X。</g我ven-names> </name> </person-group> <person-group person-group-type="editor"> <name> <surname> 波里</年代urname> <given-names> g D。</g我ven-names> </name> <name> <surname> Picialli</年代urname> <given-names> 一个。</g我ven-names> </name> <name> <surname> 教皇</年代urname> <given-names> s T。</g我ven-names> </name> <name> <surname> 道路</年代urname> <given-names> C。</g我ven-names> </name> </person-group> <article-title> 韵与正弦信号加噪声建模</gydF4y2Baarticle-title> <source> <italic> 音乐信号处理</我talic> <year> 1997年</gydF4y2Bayear> <publisher-loc> Lisse、荷兰</pgydF4y2Baublisher-loc> <publisher-name> 不要& Zeiltlinger</pgydF4y2Baublisher-name> </nlm-citation> </ref> <ref id="B51" content-type="article"> <label>50</lgydF4y2Baabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Yilmaz</年代urname> <given-names> O。</g我ven-names> </name> <aff> <email> oyilmaz@math.umd.edu</gydF4y2Baemail> </aff> <name> <surname> 理查德</年代urname> <given-names> 年代。</g我ven-names> </name> <aff> <email> rickard@ieee.org</gydF4y2Baemail> </aff> </person-group> <article-title> 通过时频掩蔽言论盲分离混合物</gydF4y2Baarticle-title> <source> <italic> IEEE信号处理</我talic> <year> 2004年</gydF4y2Bayear> <volume> 52</gydF4y2Bavolume> <issue> 7</我年代年代ue> <fpage> 1830年</fpgydF4y2Baage> <lpage> 1847年</lpgydF4y2Baage> <pub-id pub-id-type="doi"> 10.1109 / TSP.2004.828896</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B48" content-type="misc"> <label>51</lgydF4y2Baabel> <nlm-citation publication-type="other"> <person-group person-group-type="author"> <name> <surname> Siedlaczek</年代urname> <given-names> P。</g我ven-names> </name> </person-group> <comment> 先进的乐团图书馆集合,1997</cgydF4y2Baomment> </nlm-citation> </ref> <ref id="B52" content-type="article"> <label>52</lgydF4y2Baabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 文森特</年代urname> <given-names> E。</g我ven-names> </name> <aff> <email> emmanuel.vincent@elec.qmul.ac.uk</gydF4y2Baemail> </aff> <name> <surname> Gribonval</年代urname> <given-names> R。</g我ven-names> </name> <aff> <email> remi.gribonval@irisa.fr</gydF4y2Baemail> </aff> <name> <surname> Fevotte</年代urname> <given-names> C。</g我ven-names> </name> <aff> <email> cf269@eng.cam.ac.uk</gydF4y2Baemail> </aff> </person-group> <article-title> 性能度量的盲音频源分离</gydF4y2Baarticle-title> <source> <italic> IEEE音频、语音和语言处理</我talic> <year> 2006年</gydF4y2Bayear> <volume> 14</gydF4y2Bavolume> <issue> 4</我年代年代ue> <fpage> 1462年</fpgydF4y2Baage> <lpage> 1469年</lpgydF4y2Baage> <pub-id pub-id-type="doi"> 10.1109 / TSA.2005.858005</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B53" content-type="misc"> <label>53</lgydF4y2Baabel> <nlm-citation publication-type="other"> <comment> BSS_Eval工具箱,<gydF4y2Baext-link ext-link-type="url" xlink:href="http://bassdb.gforge.inria.fr/bss_eval"> http://bassdb.gforge.inria.fr/bss_eval</gydF4y2Baext-link> </comment> </nlm-citation> </ref> </ref-list> </back> </article> </body> </html>