Motor-imagery-based脑-机接口(bci)通常使用常见的空间模式过滤器(CSP)之前的预处理步骤特征提取和分类。监督算法CSP方法,因此需要科目的训练数据校准,这是非常耗时的收集。为了减少校准数据,需要一个新的主题,一个可以应用多任务(从现在开始称为综合性)机器学习技术的预处理阶段。在这里,综合性学习的目的是学习一个新的主题空间滤波器基于自己的数据和其他科目。本文概述了多任务的细节CSP算法和显示结果在两个数据集。在某些科目可以看到明显改善,特别是当训练试验的数量相对较低。
1。介绍
BCI系统的开发是一个活跃的研究领域,目标来帮助人们,患有严重残疾,恢复通信环境通过另一个接口。这样的BCI系统可分为几类基于他们所使用的信号特征。其中的一些特性,比如P300 [<一个href=”#B1">1一个>)和稳态视觉诱发电位(ssvep) [<一个href=”#B2">2一个>)是由外界刺激引起自然而其他像感觉运动节奏死因特异性)可以独立调节的问题。的,这可以通过执行任务的想象不同的动作,如左、右手运动,或脚和舌头的运动。皮质参与运动机能(和运动图像)显示出强劲的8 - 12赫兹(甚至18-26 Hz)活动当人不执行任何电动机(图像)的任务。然而,当人从事电动机任务时,神经网络在相应的大脑皮层区域被激活。这一块空闲同步放电的神经元,从而导致可衡量的衰减频带。减少权力也被称为事件相关去同步化(ERD) [<一个href=”#B3">3一个>],相反的效果称为与事件相关同步(人)。的位置(电极)这一特性取决于电机的类型的任务。举个例子,如果一个人他的左臂移动,运动的大脑区域侧(电极周围C4)将显示ERD特性,在神经元的细胞内电位侧皮质运动区继续振荡更加同步。
由于低空间分辨率的脑电图(EEG),一个常用的方法来改善这一决议是常见的空间模式(CSP)算法引入的kol [<一个href=”#B4">4一个>)检测异常脑电图活动。之后,它被用于歧视想象手运动的任务(<一个href=”#B5">5一个>,<一个href=”#B6">6一个>]。从那时起,很多组织改进CSP的基本算法与时间过滤(通过扩展<一个href=”#B7">7一个>对非平稳[],使它更健壮<一个href=”#B8">8一个>)或减少上一次校准时间转移知识学习(<一个href=”#B9">9一个>]。十多年后,这种方法仍然证明了其优越性从第四(BCI竞争的结果<一个href=”http://www.bbci.de/competition/iv/" target="_blank">http://www.bbci.de/competition/iv/一个>你可以找到的数据集和结果第四BCI竞争)。不过,这比P300-based BCI BCI设置不准确,首先需要一个较长的训练时间。一些人甚至无法实现适当的控制。
进一步提高科目的CSP滤波器的一种方法是使用来自其他学科的数据记录,另外主题的数据。为此,我们将使用一些想法的综合性学习,机器学习的一个活跃的话题(<一个href=”#B10">10一个>,<一个href=”#B11">11一个>]。在[<一个href=”#B12">12一个>),作者运用这一概念学习分类器,能够从多个学科,导致一个算法执行新的科目即使没有培训。分类器可以适应新数据变得可用时,与训练样本很少达成更高的分类精度。然而,他们应用拉普拉斯算子的过滤器,而不是基于CSP的空间滤波器算法和使用特性从脑电图信号获得滤波后在不同的传输频带。与他们的方法,我们将从基本算法CSP和综合性学习的概念应用于预处理阶段。一般来说,综合性学习算法假设所有任务相似。在我们的第一个方法中,我们也会假定所有科目也有类似的头部模型,因此,空间过滤器可以分解成一个科目的一部分和一个全球的部分。在第二个方法中,我们不会做这样的假设,而是我们假定他们被组合在一起在一个固定数量的集群。此外,我们包括参数之间做出权衡这些全球和科目的过滤器。
部分<一个href=”#sec2">2一个>给了第一种方法的细节我们的综合性CSP算法,而部分<一个href=”#sec4">4一个>介绍了基于集群的综合性CSP算法。部分<一个href=”#sec3">3一个>提出了一种优化聚类框架CSP过滤器,这也将在后续部分中使用<一个href=”#sec4">4一个>。结果与基本算法CSP部分<一个href=”#sec5">5一个>在一个模拟数据集和两个实验数据集,其中一个是公开在网站上第三BCI竞争(<一个href=”#B13">13一个>14)和一个包含数据对象记录马克斯普朗克研究所的生物控制论。部分<一个href=”#sec6">6一个>该方法的优点和缺点。
基本CSP方法的目标是学习的一组为一个主题空间过滤器最大化信号方差试验的一个类,同时最小化信号方差为试验的其他类。在两种情况下,这可以制定如下:<年代pan class="equation" id="EEq1">
在哪里<年代vg height="13.775" id="M2" style="vertical-align:-0.0pt;width:23.25px;" version="1.1" viewbox="0 0 23.25 13.775" width="23.25" xmlns="http://www.w3.org/2000/svg">
Σ
(
1
)
和<年代vg height="13.775" id="M3" style="vertical-align:-0.0pt;width:23.25px;" version="1.1" viewbox="0 0 23.25 13.775" width="23.25" xmlns="http://www.w3.org/2000/svg">
Σ
(
2
)
对应于试验的协方差矩阵对应于第一和第二课,分别。
我们现在想要使用其他科目的数据提高过滤器的特定主题。为此,我们首先需要一个空间滤波器<年代vg height="11.3625" id="M4" style="vertical-align:-3.2316pt;width:16.85px;" version="1.1" viewbox="0 0 16.85 11.3625" width="16.85" xmlns="http://www.w3.org/2000/svg">
对于每一个主题,我们分解为一个全球性的和科目的一部分,<年代pan class="equation" id="eq1">
在哪里<年代vg height="17.75" id="M6" style="vertical-align:-3.25793pt;width:55.662498px;" version="1.1" viewbox="0 0 55.662498 17.75" width="55.662498" xmlns="http://www.w3.org/2000/svg">
0
∈
ℝ
代表了全球空间滤波器和学习所有科目和共享<年代vg height="17.7125" id="M7" style="vertical-align:-3.2316pt;width:51.537498px;" version="1.1" viewbox="0 0 51.537498 17.7125" width="51.537498" xmlns="http://www.w3.org/2000/svg">
∈
ℝ
代表了科目的过滤器的一部分。通道的数量是由<年代vg height="10.75" id="M8" style="vertical-align:-0.15048pt;width:9.375px;" version="1.1" viewbox="0 0 9.375 10.75" width="9.375" xmlns="http://www.w3.org/2000/svg">
。一个优化框架提出了我们学习这两种类型的过滤器。这可以作为制定<年代pan class="equation" id="EEq2">
哪里用的<年代vg height="10.725" id="M10" style="vertical-align:-0.1254pt;width:11.375px;" version="1.1" viewbox="0 0 11.375 10.725" width="11.375" xmlns="http://www.w3.org/2000/svg">
。
的参数<年代vg height="14.475" id="M11" style="vertical-align:-3.13504pt;width:14.675px;" version="1.1" viewbox="0 0 14.675 14.475" width="14.675" xmlns="http://www.w3.org/2000/svg">
1
和<年代vg height="14.475" id="M12" style="vertical-align:-3.13504pt;width:14.675px;" version="1.1" viewbox="0 0 14.675 14.475" width="14.675" xmlns="http://www.w3.org/2000/svg">
2
使我们之间做出权衡全球或特定的过滤器。高的价值<年代vg height="14.475" id="M13" style="vertical-align:-3.13504pt;width:14.675px;" version="1.1" viewbox="0 0 14.675 14.475" width="14.675" xmlns="http://www.w3.org/2000/svg">
1
和低的价值<年代vg height="14.475" id="M14" style="vertical-align:-3.13504pt;width:14.675px;" version="1.1" viewbox="0 0 14.675 14.475" width="14.675" xmlns="http://www.w3.org/2000/svg">
2
,向量<年代vg height="11.3875" id="M15" style="vertical-align:-3.25793pt;width:17.5px;" version="1.1" viewbox="0 0 17.5 11.3875" width="17.5" xmlns="http://www.w3.org/2000/svg">
0
被迫零和一个特定的过滤器。当<年代vg height="14.475" id="M16" style="vertical-align:-3.13504pt;width:14.675px;" version="1.1" viewbox="0 0 14.675 14.475" width="14.675" xmlns="http://www.w3.org/2000/svg">
2
高,<年代vg height="14.475" id="M17" style="vertical-align:-3.13504pt;width:14.675px;" version="1.1" viewbox="0 0 14.675 14.475" width="14.675" xmlns="http://www.w3.org/2000/svg">
1
低,向量<年代vg height="11.3625" id="M18" style="vertical-align:-3.2316pt;width:13.375px;" version="1.1" viewbox="0 0 13.375 11.3625" width="13.375" xmlns="http://www.w3.org/2000/svg">
被迫0和更多的全球过滤器计算。此外,还可以执行一个正则化选择<年代vg height="14.475" id="M19" style="vertical-align:-3.13504pt;width:14.675px;" version="1.1" viewbox="0 0 14.675 14.475" width="14.675" xmlns="http://www.w3.org/2000/svg">
1
和<年代vg height="14.475" id="M20" style="vertical-align:-3.13504pt;width:14.675px;" version="1.1" viewbox="0 0 14.675 14.475" width="14.675" xmlns="http://www.w3.org/2000/svg">
2
高。
上述方程可以改写一个更简单的形式,也就是说,一笔convex-to-convex比率<年代pan class="equation" id="EEq3">
与<年代pan class="equation" id="eq2">
在哪里<年代vg height="14.5125" id="M23" style="vertical-align:-3.35449pt;width:27.549999px;" version="1.1" viewbox="0 0 27.549999 14.5125" width="27.549999" xmlns="http://www.w3.org/2000/svg">
×
代表了<年代vg height="10.75" id="M24" style="vertical-align:-0.15048pt;width:9.375px;" version="1.1" viewbox="0 0 9.375 10.75" width="9.375" xmlns="http://www.w3.org/2000/svg">
维统一矩阵。
找到最大的(<一个href=”#EEq3">4一个>我们用牛顿法。为此,我们需要梯度和黑森(<一个href=”#EEq3">4一个>)。的梯度,<年代pan class="equation" id="eq3">
海赛是由,<年代pan class="equation" id="eq4">
在哪里<年代vg height="14.5875" id="M27" style="vertical-align:-3.2316pt;width:13.425px;" version="1.1" viewbox="0 0 13.425 14.5875" width="13.425" xmlns="http://www.w3.org/2000/svg">
短暂的分母项<年代vg height="11.05" id="M28" style="vertical-align:-3.2316pt;width:11.9375px;" version="1.1" viewbox="0 0 11.9375 11.05" width="11.9375" xmlns="http://www.w3.org/2000/svg">
和<年代vg height="18.775" id="M29" style="vertical-align:-2.96555pt;width:24.275px;" version="1.1" viewbox="0 0 24.275 18.775" width="24.275" xmlns="http://www.w3.org/2000/svg">
∇
(
)
的梯度<年代vg height="11.05" id="M30" style="vertical-align:-3.2316pt;width:11.9375px;" version="1.1" viewbox="0 0 11.9375 11.05" width="11.9375" xmlns="http://www.w3.org/2000/svg">
关于<年代vg height="7.5500002" id="M31" style="vertical-align:-0.17555pt;width:11.4125px;" version="1.1" viewbox="0 0 11.4125 7.5500002" width="11.4125" xmlns="http://www.w3.org/2000/svg">
。
从现在起,这个方法用缩写“mtCSP。”
3所示。聚类空间滤波器的优化框架
之前的细节基于集群的综合性CSP算法,我们提出了一个聚类优化算法CSP过滤器。这个算法是受[<一个href=”#B14">14一个>),将形成的基础在下一节中描述的算法。它还将用来找到一个好的初始化的变量基于集群的综合性CSP算法。
所以,让我们开始提出了优化框架的简化版本(<一个href=”#B14">14一个>]<年代pan class="equation" id="EEq4">
在哪里<年代vg height="10.325" id="M34" style="vertical-align:-0.0pt;width:13.2875px;" version="1.1" viewbox="0 0 13.2875 10.325" width="13.2875" xmlns="http://www.w3.org/2000/svg">
是集群的数量,<年代vg height="10.725" id="M35" style="vertical-align:-0.1254pt;width:11.375px;" version="1.1" viewbox="0 0 11.375 10.725" width="11.375" xmlns="http://www.w3.org/2000/svg">
观察的数量,<年代vg height="11.3625" id="M36" style="vertical-align:-3.2316pt;width:13.375px;" version="1.1" viewbox="0 0 13.375 11.3625" width="13.375" xmlns="http://www.w3.org/2000/svg">
的观察,<年代vg height="11.1875" id="M37" style="vertical-align:-3.2316pt;width:16.612499px;" version="1.1" viewbox="0 0 16.612499 11.1875" width="16.612499" xmlns="http://www.w3.org/2000/svg">
集群中心和<年代vg height="10.75" id="M38" style="vertical-align:-0.15048pt;width:9.375px;" version="1.1" viewbox="0 0 9.375 10.75" width="9.375" xmlns="http://www.w3.org/2000/svg">
一个距离函数。二进制系数<年代vg height="11.05" id="M39" style="vertical-align:-3.2316pt;width:20.299999px;" version="1.1" viewbox="0 0 20.299999 11.05" width="20.299999" xmlns="http://www.w3.org/2000/svg">
表明某个对象所属集群。这最小化通常骑自行车通过两个步骤来解决。在第一步中,系数<年代vg height="11.05" id="M40" style="vertical-align:-3.2316pt;width:20.299999px;" version="1.1" viewbox="0 0 20.299999 11.05" width="20.299999" xmlns="http://www.w3.org/2000/svg">
确定通过设置<年代vg height="10.7375" id="M41" style="vertical-align:-0.13794pt;width:8.6000004px;" version="1.1" viewbox="0 0 8.6000004 10.7375" width="8.6000004" xmlns="http://www.w3.org/2000/svg">
如果该对象th系数<年代vg height="11.3625" id="M42" style="vertical-align:-3.2316pt;width:13.375px;" version="1.1" viewbox="0 0 13.375 11.3625" width="13.375" xmlns="http://www.w3.org/2000/svg">
是最接近集群中心<年代vg height="11.1875" id="M43" style="vertical-align:-3.2316pt;width:16.612499px;" version="1.1" viewbox="0 0 16.612499 11.1875" width="16.612499" xmlns="http://www.w3.org/2000/svg">
在第二步中,我们发现集群中心最小化总距离他们的集群成员决定的系数<年代vg height="11.05" id="M45" style="vertical-align:-3.2316pt;width:20.299999px;" version="1.1" viewbox="0 0 20.299999 11.05" width="20.299999" xmlns="http://www.w3.org/2000/svg">
在上一步中计算。鉴于系数<年代vg height="11.05" id="M46" style="vertical-align:-3.2316pt;width:20.299999px;" version="1.1" viewbox="0 0 20.299999 11.05" width="20.299999" xmlns="http://www.w3.org/2000/svg">
,我们可以看到,内部资金是相互独立的,因此也可以相互独立地进行了优化。一个典型的距离函数是欧几里得距离。
然而,对于空间过滤器,我们必须找到一个更合适的指标。在[解释<一个href=”#B9">9一个>),不是欧几里得CSP的空间过滤器。改变长度或CSP过滤无关紧要的标志,因为它仍然是一个瑞利商的解决方案(<一个href=”#EEq1">1一个>)。换句话说,过滤器都可以认为躺在单位超球面,因此我们采用一个angle-based度量。这个指标时应该零角度是零个或两个空间之间的过滤器<年代vg height="7.0124998" id="M47" style="vertical-align:-0.16302pt;width:9.625px;" version="1.1" viewbox="0 0 9.625 7.0124998" width="9.625" xmlns="http://www.w3.org/2000/svg">
左边的和最大的时候<年代vg height="10.9125" id="M48" style="vertical-align:-0.17555pt;width:21.7875px;" version="1.1" viewbox="0 0 21.7875 10.9125" width="21.7875" xmlns="http://www.w3.org/2000/svg">
/
2
组成。因此,角的正弦平方<年代vg height="10.7375" id="M49" style="vertical-align:-0.13794pt;width:8.3125px;" version="1.1" viewbox="0 0 8.3125 10.7375" width="8.3125" xmlns="http://www.w3.org/2000/svg">
这两个过滤器之间似乎是一个合适的指标<年代pan class="equation" id="eq6">
我们现在可以填补这个表达式(<一个href=”#EEq4">8一个>)和不断下降的解决方案之一,因为它并没有改变优化问题。符号也可以下降如果我们变换(<一个href=”#EEq4">8一个>)为最大化问题,导致,<年代pan class="equation" id="eq7">
在哪里<年代vg height="11.3625" id="M52" style="vertical-align:-3.2316pt;width:17.9625px;" version="1.1" viewbox="0 0 17.9625 11.3625" width="17.9625" xmlns="http://www.w3.org/2000/svg">
代表了<年代vg height="10.7375" id="M53" style="vertical-align:-0.13794pt;width:8.6000004px;" version="1.1" viewbox="0 0 8.6000004 10.7375" width="8.6000004" xmlns="http://www.w3.org/2000/svg">
集群中心。在算法的第二步,我们必须找到最优聚类中心<年代vg height="11.3625" id="M54" style="vertical-align:-3.2316pt;width:17.9625px;" version="1.1" viewbox="0 0 17.9625 11.3625" width="17.9625" xmlns="http://www.w3.org/2000/svg">
这可以独立完成每个集群(因此每个内心的总和)。在假设下<年代vg height="17.549999" id="M55" style="vertical-align:-3.2316pt;width:56.787498px;" version="1.1" viewbox="0 0 56.787498 17.549999" width="56.787498" xmlns="http://www.w3.org/2000/svg">
=
1
,这对集群内部和<年代vg height="10.7375" id="M56" style="vertical-align:-0.13794pt;width:8.6000004px;" version="1.1" viewbox="0 0 8.6000004 10.7375" width="8.6000004" xmlns="http://www.w3.org/2000/svg">
可以写成<年代pan class="equation" id="EEq6">
在哪里<年代vg height="14.5875" id="M58" style="vertical-align:-3.2316pt;width:16.8375px;" version="1.1" viewbox="0 0 16.8375 14.5875" width="16.8375" xmlns="http://www.w3.org/2000/svg">
所有过滤器,属于<年代vg height="10.7375" id="M59" style="vertical-align:-0.13794pt;width:8.6000004px;" version="1.1" viewbox="0 0 8.6000004 10.7375" width="8.6000004" xmlns="http://www.w3.org/2000/svg">
集群。这个表达式必须最大化对<年代vg height="11.3625" id="M60" style="vertical-align:-3.2316pt;width:17.9625px;" version="1.1" viewbox="0 0 17.9625 11.3625" width="17.9625" xmlns="http://www.w3.org/2000/svg">
。最大的是协方差矩阵的主成分集群内的过滤器<年代vg height="10.7375" id="M61" style="vertical-align:-0.13794pt;width:8.6000004px;" version="1.1" viewbox="0 0 8.6000004 10.7375" width="8.6000004" xmlns="http://www.w3.org/2000/svg">
因此等于最大特征值的特征向量对应的特征值分解。
4所示。基于集群的综合性CSP
节<一个href=”#sec2">2一个>,我们假设所有科目都相似。这种假设当然应该放松。在这里,我们提出一种算法,在集群组类似的主题。然后进行跨学科学习的每一个单独的集群。该方法受节中描述的优化算法<一个href=”#sec3">3一个>。
首先,我们引入多个共享过滤器<年代vg height="11.3625" id="M62" style="vertical-align:-3.2316pt;width:17.9625px;" version="1.1" viewbox="0 0 17.9625 11.3625" width="17.9625" xmlns="http://www.w3.org/2000/svg">
,一个用于每个集群<年代vg height="10.7375" id="M63" style="vertical-align:-0.13794pt;width:8.6000004px;" version="1.1" viewbox="0 0 8.6000004 10.7375" width="8.6000004" xmlns="http://www.w3.org/2000/svg">
,<年代pan class="equation" id="eq8">
我们现在可以变换问题(<一个href=”#EEq4">8一个>)最大化问题和替换的距离函数商类似于(<一个href=”#EEq2">3一个>),导致以下公式:<年代pan class="equation" id="EEq7">
在第一步中,系数<年代vg height="11.05" id="M66" style="vertical-align:-3.2316pt;width:20.299999px;" version="1.1" viewbox="0 0 20.299999 11.05" width="20.299999" xmlns="http://www.w3.org/2000/svg">
能在类似的方式再决定<年代pan class="equation" id="EEq8">
在第二步中,我们应用综合性CSP算法部分中讨论<一个href=”#sec2">2一个>最大化的内在和(<一个href=”#EEq7">15一个>)对<年代vg height="11.3625" id="M68" style="vertical-align:-3.2316pt;width:17.9625px;" version="1.1" viewbox="0 0 17.9625 11.3625" width="17.9625" xmlns="http://www.w3.org/2000/svg">
和<年代vg height="11.3625" id="M69" style="vertical-align:-3.2316pt;width:19.299999px;" version="1.1" viewbox="0 0 19.299999 11.3625" width="19.299999" xmlns="http://www.w3.org/2000/svg">
属于各自的学科集群<年代vg height="10.7375" id="M70" style="vertical-align:-0.13794pt;width:8.6000004px;" version="1.1" viewbox="0 0 8.6000004 10.7375" width="8.6000004" xmlns="http://www.w3.org/2000/svg">
。这就完成了算法的两个步骤。然而,仍有小问题,第一步是科目的向量<年代vg height="11.3625" id="M71" style="vertical-align:-3.2316pt;width:17.075001px;" version="1.1" viewbox="0 0 17.075001 11.3625" width="17.075001" xmlns="http://www.w3.org/2000/svg">
未知的对象属于集群<年代vg height="10.7375" id="M72" style="vertical-align:-0.13794pt;width:8.6000004px;" version="1.1" viewbox="0 0 8.6000004 10.7375" width="8.6000004" xmlns="http://www.w3.org/2000/svg">
。这是因为在第二步计算<年代vg height="11.3625" id="M73" style="vertical-align:-3.2316pt;width:19.299999px;" version="1.1" viewbox="0 0 19.299999 11.3625" width="19.299999" xmlns="http://www.w3.org/2000/svg">
只属于主题<年代vg height="10.7375" id="M74" style="vertical-align:-0.13794pt;width:8.6000004px;" version="1.1" viewbox="0 0 8.6000004 10.7375" width="8.6000004" xmlns="http://www.w3.org/2000/svg">
集群。为此,我们仍然需要优化的商(<一个href=”#EEq7">15一个>为每个主题分别对)<年代vg height="11.3625" id="M75" style="vertical-align:-3.2316pt;width:17.075001px;" version="1.1" viewbox="0 0 17.075001 11.3625" width="17.075001" xmlns="http://www.w3.org/2000/svg">
和固定<年代vg height="11.35" id="M76" style="vertical-align:-3.22282pt;width:15.725px;" version="1.1" viewbox="0 0 15.725 11.35" width="15.725" xmlns="http://www.w3.org/2000/svg">
为每一个<年代vg height="13" id="M77" style="vertical-align:-1.95624pt;width:29.7875px;" version="1.1" viewbox="0 0 29.7875 13" width="29.7875" xmlns="http://www.w3.org/2000/svg">
≠
(<年代vg height="10.7375" id="M78" style="vertical-align:-0.13794pt;width:8.6000004px;" version="1.1" viewbox="0 0 8.6000004 10.7375" width="8.6000004" xmlns="http://www.w3.org/2000/svg">
代表集群主体所属)。
最后,我们也要找到一个好的初始化的变量。为此,我们使用聚类算法中描述的部分<一个href=”#sec3">3一个>并将其应用在科目的过滤器与CSP的基本算法计算。这给了我们一个集群的初始估计系数<年代vg height="11.05" id="M79" style="vertical-align:-3.2316pt;width:20.299999px;" version="1.1" viewbox="0 0 20.299999 11.05" width="20.299999" xmlns="http://www.w3.org/2000/svg">
。我们还可以使用集群中心以及它们之间的区别和科目的过滤器来初始化<年代vg height="11.3625" id="M80" style="vertical-align:-3.2316pt;width:17.9625px;" version="1.1" viewbox="0 0 17.9625 11.3625" width="17.9625" xmlns="http://www.w3.org/2000/svg">
和<年代vg height="11.3625" id="M81" style="vertical-align:-3.2316pt;width:19.299999px;" version="1.1" viewbox="0 0 19.299999 11.3625" width="19.299999" xmlns="http://www.w3.org/2000/svg">
,分别。
5。实验
5.1。模拟数据
模拟数据生成两个集群的20相似的任务。每个任务的训练集包含两个条件的数据,每个条件计算15个样本。源产生的变量是一个二维高斯分布与零均值和协方差矩阵依赖条件,但同样的集群和所有任务,<年代pan class="equation" id="eq9">
混合矩阵的列也从二维高斯分布,生成参数化的各向同性的低方差协方差矩阵(<年代vg height="14.375" id="M83" style="vertical-align:-0.3135pt;width:54.099998px;" version="1.1" viewbox="0 0 54.099998 14.375" width="54.099998" xmlns="http://www.w3.org/2000/svg">
1
×
1
0
−
4
)。手段是固定的两个集群和不同,但相同的所有任务在同一集群<年代pan class="equation" id="eq10">
我们还添加了一些噪音与零均值和方差非常低(<年代vg height="14.375" id="M85" style="vertical-align:-0.3135pt;width:54.099998px;" version="1.1" viewbox="0 0 54.099998 14.375" width="54.099998" xmlns="http://www.w3.org/2000/svg">
1
×
1
0
−
3
)混合观测。一个样本训练集显示在图中<一个href=”//www.newsama.com/journals/cin/2011/217987/fig1/" target="_blank">1(一)一个>。与285年创建一个类似的测试集数据点的条件。然后我们申请的基本CSP (bCSP)方法在每个这些任务分别和比较它与集群综合性版本(clmtCSP)。CSP的基本解决方案是第一显示25(40)的任务图<一个href=”//www.newsama.com/journals/cin/2011/217987/fig1/" target="_blank">1 (b)一个>。的最终解决集群综合性学习方法如图<一个href=”//www.newsama.com/journals/cin/2011/217987/fig1/" target="_blank">1 (c)一个>。在这个玩具的例子中,我们没有对具体执行preclustering过滤器来找到一个好的初始化。相反,前20个任务被认为是(或初始化)属于第一个集群和过去的20任务被认为是属于第二个集群。通过这种方式,我们可以检查的算法能够找到正确的集群。图<一个href=”//www.newsama.com/journals/cin/2011/217987/fig1/" target="_blank">1 (c)一个>告诉我们,该算法完全可以将任务分配到正确的集群。然而,它是不完美的,你可以看到任务的第三行第二列。此外,可以看到,椭圆的主轴后更好地结合应用clmtCSP算法相比bCSP解决方案。量化这两种方法之间的区别,我们计算估计的方差比率(纯粹的观察),导致来源<年代pan class="equation" id="eq11">
分别对每个源。这些比率的计算集群。因为来源可以切换和订单不一定是相同的对于这两种方法,我们从高到低排序比率。然后比较这两个比例最高的两种方法,是两个最低。这些结果总结每个集群的箱线图,图<一个href=”//www.newsama.com/journals/cin/2011/217987/fig2/" target="_blank">2一个>。我们可以看到,中位数clmtCSP总是更大比例的方法。成对魏克森讯号等级测试拒绝平等中位数的假说来源和两个集群。相应的<年代vg height="10.325" id="M87" style="vertical-align:-0.0pt;width:16.9625px;" version="1.1" viewbox="0 0 16.9625 10.325" width="16.9625" xmlns="http://www.w3.org/2000/svg">
值给出图<一个href=”//www.newsama.com/journals/cin/2011/217987/fig2/" target="_blank">2一个>。
(一)训练集年代trong>
(b) bCSP年代trong>
(c) clmtCSP年代trong>