3.2.1之上。运动模式学习gydF4y2Ba
如引言部分中所述,有很多方法来表示数据的运动。在本文中,我们使用一个修改ISOMAP算法(gydF4y2Ba
33gydF4y2Ba)项目6-dimensional数据空间到二维空间。著作的运动在三维笛卡尔空间是由6个关节。然而,作品的特点是二维的,因为字符写在一个二维平面。所以它是合理的使用功能为其他使用一个二维平面。使用这个修改的额外动机ISOMAP算法可视化研究人员的抽样数据在二维平面上轻易找到运动的特性,并使二维平面上的轨迹没有重叠部分内部本身或十字路口内本身。使用该算法,空间和时间的特征样本数据可以在一个二维可视化。gydF4y2Ba
我们想要提到降维并不是所有应用程序所必需的。摘要降维提取方便识别的特性和使用特性。gydF4y2Ba
指定的原始ISOMAP算法算法如下。gydF4y2Ba
示例演示轨迹上的点:gydF4y2Ba
(1)gydF4y2Ba
θgydF4y2Ba
年代gydF4y2Ba
=gydF4y2Ba
{gydF4y2Ba
θgydF4y2Ba
vgydF4y2Ba
,gydF4y2Ba
tgydF4y2Ba
}gydF4y2Ba
。gydF4y2Ba
计算测地线距离矩阵DgydF4y2Ba女士gydF4y2Ba:gydF4y2Ba
(2)gydF4y2Ba
DgydF4y2Ba
GsgydF4y2Ba
(gydF4y2Ba
我gydF4y2Ba
,gydF4y2Ba
jgydF4y2Ba
)gydF4y2Ba
=gydF4y2Ba
{gydF4y2Ba
为gydF4y2Ba
θgydF4y2Ba
vgydF4y2Ba
我gydF4y2Ba
- - - - - -gydF4y2Ba
θgydF4y2Ba
vgydF4y2Ba
jgydF4y2Ba
为gydF4y2Ba
,gydF4y2Ba
如果gydF4y2Ba
为gydF4y2Ba
θgydF4y2Ba
vgydF4y2Ba
我gydF4y2Ba
- - - - - -gydF4y2Ba
θgydF4y2Ba
vgydF4y2Ba
jgydF4y2Ba
为gydF4y2Ba
≤gydF4y2Ba
dgydF4y2Ba
0gydF4y2Ba
,gydF4y2Ba
否则gydF4y2Ba
DgydF4y2Ba
女士gydF4y2Ba
(gydF4y2Ba
我gydF4y2Ba
,gydF4y2Ba
jgydF4y2Ba
)gydF4y2Ba
=gydF4y2Ba
最小值gydF4y2Ba
(gydF4y2Ba
DgydF4y2Ba
GsgydF4y2Ba
(gydF4y2Ba
我gydF4y2Ba
,gydF4y2Ba
jgydF4y2Ba
)gydF4y2Ba
,gydF4y2Ba
DgydF4y2Ba
GsgydF4y2Ba
(gydF4y2Ba
我gydF4y2Ba
,gydF4y2Ba
kgydF4y2Ba
)gydF4y2Ba
+gydF4y2Ba
DgydF4y2Ba
GsgydF4y2Ba
(gydF4y2Ba
kgydF4y2Ba
,gydF4y2Ba
jgydF4y2Ba
)gydF4y2Ba
)gydF4y2Ba
,gydF4y2Ba
kgydF4y2Ba
=gydF4y2Ba
1、2gydF4y2Ba
,gydF4y2Ba
…gydF4y2Ba
,gydF4y2Ba
NgydF4y2Ba
,gydF4y2Ba
DgydF4y2Ba
女士gydF4y2Ba
迭代计算,直到值元素的融合。gydF4y2Ba
在原始ISOMAP算法,gydF4y2Ba
∥gydF4y2Ba
θgydF4y2Ba
vgydF4y2Ba
我gydF4y2Ba
- - - - - -gydF4y2Ba
θgydF4y2Ba
vgydF4y2Ba
jgydF4y2Ba
∥gydF4y2Ba
被定义为一个欧氏空间两点间的距离:gydF4y2Ba
θgydF4y2Ba
vgydF4y2Ba
我gydF4y2Ba
和gydF4y2Ba
θgydF4y2Ba
vgydF4y2Ba
jgydF4y2Ba
。在我们修改ISOMAP算法,gydF4y2Ba
∥gydF4y2Ba
θgydF4y2Ba
vgydF4y2Ba
我gydF4y2Ba
- - - - - -gydF4y2Ba
θgydF4y2Ba
vgydF4y2Ba
jgydF4y2Ba
∥gydF4y2Ba
被定义为两个点之间的时间距离:gydF4y2Ba
θgydF4y2Ba
vgydF4y2Ba
我gydF4y2Ba
和gydF4y2Ba
θgydF4y2Ba
vgydF4y2Ba
jgydF4y2Ba
。gydF4y2Ba
θgydF4y2Ba
vgydF4y2Ba
用于记录六个关节的角度:gydF4y2Ba
θgydF4y2Ba
vgydF4y2Ba
=gydF4y2Ba
θgydF4y2Ba
vgydF4y2Ba
1gydF4y2Ba
,gydF4y2Ba
θgydF4y2Ba
vgydF4y2Ba
2gydF4y2Ba
,gydF4y2Ba
…gydF4y2Ba
,gydF4y2Ba
θgydF4y2Ba
vgydF4y2Ba
NgydF4y2Ba
。gydF4y2Ba
计算内积,gydF4y2Ba
(3)gydF4y2Ba
τgydF4y2Ba
(gydF4y2Ba
DgydF4y2Ba
女士gydF4y2Ba
)gydF4y2Ba
=gydF4y2Ba
- - - - - -gydF4y2Ba
1gydF4y2Ba
2gydF4y2Ba
HgydF4y2Ba
年代gydF4y2Ba
HgydF4y2Ba
,gydF4y2Ba
在哪里gydF4y2Ba
年代gydF4y2Ba
我gydF4y2Ba
jgydF4y2Ba
=gydF4y2Ba
DgydF4y2Ba
女士gydF4y2Ba
我gydF4y2Ba
jgydF4y2Ba
2gydF4y2Ba
,gydF4y2Ba
和gydF4y2Ba
HgydF4y2Ba
=gydF4y2Ba
δgydF4y2Ba
我gydF4y2Ba
jgydF4y2Ba
- - - - - -gydF4y2Ba
(gydF4y2Ba
1gydF4y2Ba
/gydF4y2Ba
NgydF4y2Ba
)gydF4y2Ba
(gydF4y2Ba
δgydF4y2Ba
我gydF4y2Ba
jgydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
,gydF4y2Ba
当gydF4y2Ba
我gydF4y2Ba
=gydF4y2Ba
jgydF4y2Ba
,gydF4y2Ba
δgydF4y2Ba
我gydF4y2Ba
jgydF4y2Ba
=gydF4y2Ba
0gydF4y2Ba
,gydF4y2Ba
当gydF4y2Ba
我gydF4y2Ba
≠gydF4y2Ba
jgydF4y2Ba
)gydF4y2Ba
。gydF4y2Ba
计算的新坐标采样点的空间gydF4y2Ba
XgydF4y2Ba
:gydF4y2Ba
(4)gydF4y2Ba
xgydF4y2Ba
我gydF4y2Ba
=gydF4y2Ba
(gydF4y2Ba
λgydF4y2Ba
年代gydF4y2Ba
1gydF4y2Ba
αgydF4y2Ba
年代gydF4y2Ba
1gydF4y2Ba
,gydF4y2Ba
λgydF4y2Ba
年代gydF4y2Ba
2gydF4y2Ba
αgydF4y2Ba
年代gydF4y2Ba
2gydF4y2Ba
)gydF4y2Ba
TgydF4y2Ba
,gydF4y2Ba
在哪里gydF4y2Ba
λgydF4y2Ba
1gydF4y2Ba
和gydF4y2Ba
λgydF4y2Ba
2gydF4y2Ba
是最大的两个特征值的gydF4y2Ba
τgydF4y2Ba
(gydF4y2Ba
DgydF4y2Ba
米gydF4y2Ba
)gydF4y2Ba
有两个相应的特征向量:gydF4y2Ba
αgydF4y2Ba
1gydF4y2Ba
和gydF4y2Ba
αgydF4y2Ba
2gydF4y2Ba
。gydF4y2Ba
ISOMAP修改方法,它既反映了采样数据点之间的时间和空间关系在二维平面,用于训练机器人学习写字母在一个二维平面上的运动(gydF4y2Ba
33gydF4y2Ba]。gydF4y2Ba
原ISOMAP MDS的延伸,它构造矩阵通过连接采样点的距离的邻居。原ISOMAP用于描述邻居采样点之间的距离。为了找到采样轨迹的时间信息,在我们的算法的邻居被严格定义为时间的邻居。空间关系是没有定义但ISOMAP算法计算了这个修改。修改设计gydF4y2Ba
(5)gydF4y2Ba
DgydF4y2Ba
GtgydF4y2Ba
(gydF4y2Ba
我gydF4y2Ba
,gydF4y2Ba
jgydF4y2Ba
)gydF4y2Ba
=gydF4y2Ba
{gydF4y2Ba
为gydF4y2Ba
θgydF4y2Ba
vgydF4y2Ba
我gydF4y2Ba
- - - - - -gydF4y2Ba
θgydF4y2Ba
vgydF4y2Ba
jgydF4y2Ba
为gydF4y2Ba
,gydF4y2Ba
如果gydF4y2Ba
|gydF4y2Ba
tgydF4y2Ba
我gydF4y2Ba
- - - - - -gydF4y2Ba
tgydF4y2Ba
jgydF4y2Ba
|gydF4y2Ba
≤gydF4y2Ba
年代gydF4y2Ba
,gydF4y2Ba
0gydF4y2Ba
,gydF4y2Ba
否则gydF4y2Ba
,gydF4y2Ba
在哪里gydF4y2Ba
年代gydF4y2Ba
是时间阈值。在(gydF4y2Ba
1gydF4y2Ba),gydF4y2Ba
dgydF4y2Ba
空间的阈值。gydF4y2Ba
使用这种方法,gydF4y2Ba
DgydF4y2Ba
GtgydF4y2Ba
和相应的gydF4y2Ba
τgydF4y2Ba
(gydF4y2Ba
DgydF4y2Ba
太gydF4y2Ba
)gydF4y2Ba
计算。采样点的空间表示为gydF4y2Ba
ygydF4y2Ba
我gydF4y2Ba
=gydF4y2Ba
(gydF4y2Ba
λgydF4y2Ba
tgydF4y2Ba
1gydF4y2Ba
αgydF4y2Ba
tgydF4y2Ba
1gydF4y2Ba
,gydF4y2Ba
λgydF4y2Ba
tgydF4y2Ba
2gydF4y2Ba
αgydF4y2Ba
tgydF4y2Ba
2gydF4y2Ba
)gydF4y2Ba
TgydF4y2Ba
,在那里gydF4y2Ba
λgydF4y2Ba
tgydF4y2Ba
1gydF4y2Ba
和gydF4y2Ba
λgydF4y2Ba
tgydF4y2Ba
2gydF4y2Ba
是最大的两个特征值的gydF4y2Ba
τgydF4y2Ba
(gydF4y2Ba
DgydF4y2Ba
太gydF4y2Ba
)gydF4y2Ba
有两个相应的特征向量:gydF4y2Ba
αgydF4y2Ba
tgydF4y2Ba
1gydF4y2Ba
和gydF4y2Ba
αgydF4y2Ba
tgydF4y2Ba
2gydF4y2Ba
。gydF4y2Ba
2004年詹金斯和Matarić提出时空ISOMAP算法(gydF4y2Ba
34gydF4y2Ba]。他们的方法是全面和详细定义了类型的邻居。为不同的邻居,建筑的距离矩阵的方法是不同的。在我们的方法中,我们简单地添加时间限制建设距离矩阵和严格假定所有的距离应该是时间相关的。这种方法是简单而方便计算。詹金斯的方法和我们的方法都是有效的描述的时空特征的采样数据点。gydF4y2Ba
在当前的模仿学习,行为是特殊的机器人运动在特定任务相关的情况。这意味着我们可以假定的抽样数据从示威行为总是躺在同样的歧管在数据空间。预测结果的数据潜在的空间数据的空间必须在同一歧管作为示范。因此,它是合理的假设存在一个数据空间中的数据之间的关系和潜在的空间,它可以被描述为一个函数:gydF4y2Ba
(6)gydF4y2Ba
θgydF4y2Ba
vgydF4y2Ba
我gydF4y2Ba
=gydF4y2Ba
fgydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
我gydF4y2Ba
,gydF4y2Ba
WgydF4y2Ba
)gydF4y2Ba
,gydF4y2Ba
在哪里gydF4y2Ba
xgydF4y2Ba
我gydF4y2Ba
是一个潜在的空间和数据点吗gydF4y2Ba
θgydF4y2Ba
vgydF4y2Ba
我gydF4y2Ba
是一种相应的原始数据空间中的数据点。gydF4y2Ba
因此,gydF4y2Ba
fgydF4y2Ba
(gydF4y2Ba
XgydF4y2Ba
,gydF4y2Ba
WgydF4y2Ba
)gydF4y2Ba
设计作为一个广义线性回归模型:gydF4y2Ba
(7)gydF4y2Ba
θgydF4y2Ba
vgydF4y2Ba
我gydF4y2Ba
=gydF4y2Ba
WgydF4y2Ba
ΦgydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
我gydF4y2Ba
)gydF4y2Ba
。gydF4y2Ba
ΦgydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
)gydF4y2Ba
是由gydF4y2Ba
RgydF4y2Ba
基础功能:gydF4y2Ba
(8)gydF4y2Ba
ΦgydF4y2Ba
我gydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
)gydF4y2Ba
=gydF4y2Ba
经验值gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
(gydF4y2Ba
- - - - - -gydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
我gydF4y2Ba
- - - - - -gydF4y2Ba
cgydF4y2Ba
我gydF4y2Ba
)gydF4y2Ba
2gydF4y2Ba
ΣgydF4y2Ba
我gydF4y2Ba
)gydF4y2Ba
,gydF4y2Ba
我gydF4y2Ba
=gydF4y2Ba
1、2gydF4y2Ba
,gydF4y2Ba
…gydF4y2Ba
,gydF4y2Ba
RgydF4y2Ba
,gydF4y2Ba
在哪里gydF4y2Ba
cgydF4y2Ba
我gydF4y2Ba
是第i个基函数的中心和gydF4y2Ba
ΣgydF4y2Ba
我gydF4y2Ba
是带宽。均匀分布在中心的空间和带宽是专为基函数的潜在空间。gydF4y2Ba
WgydF4y2Ba
是一个gydF4y2Ba
(gydF4y2Ba
DgydF4y2Ba
- - - - - -gydF4y2Ba
1gydF4y2Ba
)gydF4y2Ba
*gydF4y2Ba
RgydF4y2Ba
矩阵哪些项目潜在的数据空间数据的空间。然而,主教核实,基函数的数量通常必须成倍增长与输入空间的维数gydF4y2Ba
35gydF4y2Ba]。这意味着利用降维计算和存储最终到达一定值随着维度的数目增加。节gydF4y2Ba
4gydF4y2Ba使用不同数量的基函数,比较的结果。gydF4y2Ba
假设投影矩阵gydF4y2Ba
WgydF4y2Ba
是已知的,概率分布的空间点数据gydF4y2Ba
(9)gydF4y2Ba
pgydF4y2Ba
(gydF4y2Ba
θgydF4y2Ba
我gydF4y2Ba
∣gydF4y2Ba
xgydF4y2Ba
我gydF4y2Ba
,gydF4y2Ba
WgydF4y2Ba
,gydF4y2Ba
βgydF4y2Ba
)gydF4y2Ba
=gydF4y2Ba
(gydF4y2Ba
βgydF4y2Ba
2gydF4y2Ba
)gydF4y2Ba
DgydF4y2Ba
经验值gydF4y2Ba
gydF4y2Ba
(gydF4y2Ba
- - - - - -gydF4y2Ba
βgydF4y2Ba
2gydF4y2Ba
为gydF4y2Ba
fgydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
,gydF4y2Ba
WgydF4y2Ba
)gydF4y2Ba
- - - - - -gydF4y2Ba
θgydF4y2Ba
为gydF4y2Ba
2gydF4y2Ba
)gydF4y2Ba
。gydF4y2Ba
日志的可能性的概率分布的点数据空间中每个点的分布概率的乘法:gydF4y2Ba
(10)gydF4y2Ba
lgydF4y2Ba
(gydF4y2Ba
WgydF4y2Ba
,gydF4y2Ba
βgydF4y2Ba
)gydF4y2Ba
=gydF4y2Ba
∑gydF4y2Ba
我gydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
NgydF4y2Ba
lngydF4y2Ba
gydF4y2Ba
gydF4y2Ba
pgydF4y2Ba
(gydF4y2Ba
tgydF4y2Ba
我gydF4y2Ba
∣gydF4y2Ba
xgydF4y2Ba
我gydF4y2Ba
,gydF4y2Ba
WgydF4y2Ba
,gydF4y2Ba
βgydF4y2Ba
)gydF4y2Ba
。gydF4y2Ba
最大化对数似然函数可以通过对数似然函数对区分gydF4y2Ba
WgydF4y2Ba
:gydF4y2Ba
(11)gydF4y2Ba
∑gydF4y2Ba
我gydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
NgydF4y2Ba
(gydF4y2Ba
WgydF4y2Ba
ΦgydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
我gydF4y2Ba
)gydF4y2Ba
- - - - - -gydF4y2Ba
θgydF4y2Ba
我gydF4y2Ba
)gydF4y2Ba
ΦgydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
我gydF4y2Ba
)gydF4y2Ba
TgydF4y2Ba
=gydF4y2Ba
0gydF4y2Ba
。gydF4y2Ba
重写(gydF4y2Ba
11gydF4y2Ba):gydF4y2Ba
(12)gydF4y2Ba
WgydF4y2Ba
∑gydF4y2Ba
我gydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
NgydF4y2Ba
ΦgydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
我gydF4y2Ba
)gydF4y2Ba
ΦgydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
我gydF4y2Ba
)gydF4y2Ba
TgydF4y2Ba
=gydF4y2Ba
∑gydF4y2Ba
我gydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
NgydF4y2Ba
θgydF4y2Ba
我gydF4y2Ba
ΦgydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
我gydF4y2Ba
)gydF4y2Ba
TgydF4y2Ba
。gydF4y2Ba
投影矩阵gydF4y2Ba
WgydF4y2Ba
可以计算出(gydF4y2Ba
11gydF4y2Ba),gydF4y2Ba
(13)gydF4y2Ba
WgydF4y2Ba
=gydF4y2Ba
∑gydF4y2Ba
我gydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
NgydF4y2Ba
θgydF4y2Ba
我gydF4y2Ba
ΦgydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
我gydF4y2Ba
)gydF4y2Ba
TgydF4y2Ba
*gydF4y2Ba
(gydF4y2Ba
∑gydF4y2Ba
我gydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
NgydF4y2Ba
ΦgydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
我gydF4y2Ba
)gydF4y2Ba
ΦgydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
我gydF4y2Ba
)gydF4y2Ba
TgydF4y2Ba
)gydF4y2Ba
__gydF4y2Ba
,gydF4y2Ba
在哪里gydF4y2Ba
(gydF4y2Ba
∑gydF4y2Ba
我gydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
NgydF4y2Ba
ΦgydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
我gydF4y2Ba
)gydF4y2Ba
ΦgydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
我gydF4y2Ba
)gydF4y2Ba
TgydF4y2Ba
)gydF4y2Ba
__gydF4y2Ba
是Moore-Penrosepseudo逆矩阵的gydF4y2Ba
∑gydF4y2Ba
我gydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
NgydF4y2Ba
ΦgydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
我gydF4y2Ba
)gydF4y2Ba
ΦgydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
我gydF4y2Ba
)gydF4y2Ba
TgydF4y2Ba
。gydF4y2Ba
采样轨迹从6-dimensional预计数据空间到二维空间使用原始ISOMAP算法和修改ISOMAP算法在“特征提取”块中。gydF4y2Ba
在潜在的空间,我们有数据点集gydF4y2Ba
XgydF4y2Ba
,这是一个二维空间。如前面所述,在“降维”,时间信息只用于计算邻域图。但在“行为”规划阶段,应结合到模型和时间信息设置为查询点。gydF4y2Ba
数据点的潜在空间遵循(gydF4y2Ba
14gydF4y2Ba):gydF4y2Ba
(14)gydF4y2Ba
xgydF4y2Ba
我gydF4y2Ba
=gydF4y2Ba
fgydF4y2Ba
(gydF4y2Ba
tgydF4y2Ba
我gydF4y2Ba
)gydF4y2Ba
,gydF4y2Ba
我gydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
,gydF4y2Ba
2gydF4y2Ba
,gydF4y2Ba
…gydF4y2Ba
,gydF4y2Ba
NgydF4y2Ba
。gydF4y2Ba
使用高斯过程(gydF4y2Ba
22gydF4y2Ba),我们可以得到一个内核基于方法的模型演示的潜在空间。二维平面上的点被描述为gydF4y2Ba
xgydF4y2Ba
我gydF4y2Ba
=gydF4y2Ba
{gydF4y2Ba
xgydF4y2Ba
′gydF4y2Ba
我gydF4y2Ba
,gydF4y2Ba
xgydF4y2Ba
′gydF4y2Ba
′gydF4y2Ba
我gydF4y2Ba
}gydF4y2Ba
,一个GP模型用于一维的空间。医生已广泛应用(gydF4y2Ba
36gydF4y2Ba- - - - - -gydF4y2Ba
39gydF4y2Ba]代表采样数据点,因为它的健壮性和非参数特征。gydF4y2Ba
假设gydF4y2Ba
NgydF4y2Ba
二维数据点在二维潜在空间概率分布如下:gydF4y2Ba
(15)gydF4y2Ba
pgydF4y2Ba
(gydF4y2Ba
zgydF4y2Ba
′gydF4y2Ba
⟶gydF4y2Ba
∣gydF4y2Ba
xgydF4y2Ba
′gydF4y2Ba
⟶gydF4y2Ba
)gydF4y2Ba
=gydF4y2Ba
NgydF4y2Ba
(gydF4y2Ba
zgydF4y2Ba
′gydF4y2Ba
⟶gydF4y2Ba
∣gydF4y2Ba
xgydF4y2Ba
′gydF4y2Ba
⟶gydF4y2Ba
,gydF4y2Ba
βgydF4y2Ba
- - - - - -gydF4y2Ba
1gydF4y2Ba
我gydF4y2Ba
)gydF4y2Ba
,gydF4y2Ba
pgydF4y2Ba
(gydF4y2Ba
zgydF4y2Ba
′gydF4y2Ba
′gydF4y2Ba
→gydF4y2Ba
∣gydF4y2Ba
xgydF4y2Ba
′gydF4y2Ba
′gydF4y2Ba
→gydF4y2Ba
)gydF4y2Ba
=gydF4y2Ba
gydF4y2Ba
(gydF4y2Ba
zgydF4y2Ba
′gydF4y2Ba
′gydF4y2Ba
→gydF4y2Ba
∣gydF4y2Ba
xgydF4y2Ba
′gydF4y2Ba
′gydF4y2Ba
→gydF4y2Ba
,gydF4y2Ba
βgydF4y2Ba
- - - - - -gydF4y2Ba
1gydF4y2Ba
我gydF4y2Ba
)gydF4y2Ba
。gydF4y2Ba
以计算在第一维度为例:gydF4y2Ba
pgydF4y2Ba
(gydF4y2Ba
zgydF4y2Ba
′gydF4y2Ba
→gydF4y2Ba
)gydF4y2Ba
=gydF4y2Ba
gydF4y2Ba
(gydF4y2Ba
zgydF4y2Ba
′gydF4y2Ba
→gydF4y2Ba
∣gydF4y2Ba
0gydF4y2Ba
,gydF4y2Ba
CgydF4y2Ba
NgydF4y2Ba
)gydF4y2Ba
,协方差矩阵gydF4y2Ba
CgydF4y2Ba
(gydF4y2Ba
ngydF4y2Ba
,gydF4y2Ba
米gydF4y2Ba
)gydF4y2Ba
=gydF4y2Ba
kgydF4y2Ba
(gydF4y2Ba
tgydF4y2Ba
ngydF4y2Ba
,gydF4y2Ba
tgydF4y2Ba
米gydF4y2Ba
)gydF4y2Ba
+gydF4y2Ba
βgydF4y2Ba
- - - - - -gydF4y2Ba
1gydF4y2Ba
δgydF4y2Ba
ngydF4y2Ba
米gydF4y2Ba
,gydF4y2Ba
zgydF4y2Ba
→gydF4y2Ba
是一个向量的目标价值。gydF4y2Ba
kgydF4y2Ba
(gydF4y2Ba
tgydF4y2Ba
ngydF4y2Ba
,gydF4y2Ba
tgydF4y2Ba
米gydF4y2Ba
)gydF4y2Ba
是内核函数。通常情况下,gydF4y2Ba
(16)gydF4y2Ba
kgydF4y2Ba
(gydF4y2Ba
tgydF4y2Ba
ngydF4y2Ba
,gydF4y2Ba
tgydF4y2Ba
米gydF4y2Ba
)gydF4y2Ba
=gydF4y2Ba
θgydF4y2Ba
0gydF4y2Ba
经验值gydF4y2Ba
gydF4y2Ba
{gydF4y2Ba
- - - - - -gydF4y2Ba
θgydF4y2Ba
1gydF4y2Ba
2gydF4y2Ba
为gydF4y2Ba
tgydF4y2Ba
ngydF4y2Ba
- - - - - -gydF4y2Ba
tgydF4y2Ba
米gydF4y2Ba
为gydF4y2Ba
2gydF4y2Ba
}gydF4y2Ba
+gydF4y2Ba
θgydF4y2Ba
2gydF4y2Ba
+gydF4y2Ba
θgydF4y2Ba
3gydF4y2Ba
tgydF4y2Ba
ngydF4y2Ba
TgydF4y2Ba
tgydF4y2Ba
米gydF4y2Ba
,gydF4y2Ba
和gydF4y2Ba
xgydF4y2Ba
ngydF4y2Ba
被认为是时间一步演示。gydF4y2Ba
在“一代”阶段,一个新的时间步gydF4y2Ba
tgydF4y2Ba
询盘gydF4y2Ba
是作为一个查询点,医生是用来计算相应的数据值gydF4y2Ba
zgydF4y2Ba
′gydF4y2Ba
询盘gydF4y2Ba
。gydF4y2Ba
(17)gydF4y2Ba
pgydF4y2Ba
(gydF4y2Ba
{gydF4y2Ba
zgydF4y2Ba
′gydF4y2Ba
⟶gydF4y2Ba
,gydF4y2Ba
zgydF4y2Ba
′gydF4y2Ba
询盘gydF4y2Ba
}gydF4y2Ba
)gydF4y2Ba
=gydF4y2Ba
NgydF4y2Ba
(gydF4y2Ba
{gydF4y2Ba
zgydF4y2Ba
′gydF4y2Ba
⟶gydF4y2Ba
,gydF4y2Ba
zgydF4y2Ba
′gydF4y2Ba
询盘gydF4y2Ba
}gydF4y2Ba
∣gydF4y2Ba
0gydF4y2Ba
,gydF4y2Ba
CgydF4y2Ba
NgydF4y2Ba
+gydF4y2Ba
1gydF4y2Ba
)gydF4y2Ba
。gydF4y2Ba
协方差矩阵:gydF4y2Ba
(18)gydF4y2Ba
CgydF4y2Ba
NgydF4y2Ba
+gydF4y2Ba
1gydF4y2Ba
=gydF4y2Ba
(gydF4y2Ba
CgydF4y2Ba
NgydF4y2Ba
kgydF4y2Ba
→gydF4y2Ba
kgydF4y2Ba
TgydF4y2Ba
→gydF4y2Ba
cgydF4y2Ba
)gydF4y2Ba
,gydF4y2Ba
在哪里gydF4y2Ba
kgydF4y2Ba
=gydF4y2Ba
kgydF4y2Ba
(gydF4y2Ba
tgydF4y2Ba
ngydF4y2Ba
,gydF4y2Ba
tgydF4y2Ba
询盘gydF4y2Ba
)gydF4y2Ba
为gydF4y2Ba
ngydF4y2Ba
=gydF4y2Ba
1、2gydF4y2Ba
,gydF4y2Ba
…gydF4y2Ba
,gydF4y2Ba
NgydF4y2Ba
。gydF4y2Ba
使用贝叶斯方法,gydF4y2Ba
zgydF4y2Ba
′gydF4y2Ba
询盘gydF4y2Ba
计算使用(gydF4y2Ba
19gydF4y2Ba)gydF4y2Ba
(19)gydF4y2Ba
zgydF4y2Ba
′gydF4y2Ba
询盘gydF4y2Ba
=gydF4y2Ba
kgydF4y2Ba
TgydF4y2Ba
→gydF4y2Ba
CgydF4y2Ba
NgydF4y2Ba
- - - - - -gydF4y2Ba
1gydF4y2Ba
zgydF4y2Ba
′gydF4y2Ba
⟶gydF4y2Ba
。gydF4y2Ba
使用相同的方法,gydF4y2Ba
zgydF4y2Ba
′gydF4y2Ba
′gydF4y2Ba
询盘gydF4y2Ba
可以计算使用(gydF4y2Ba
20.gydF4y2Ba):gydF4y2Ba
(20)gydF4y2Ba
zgydF4y2Ba
′gydF4y2Ba
′gydF4y2Ba
询盘gydF4y2Ba
=gydF4y2Ba
kgydF4y2Ba
TgydF4y2Ba
→gydF4y2Ba
CgydF4y2Ba
NgydF4y2Ba
- - - - - -gydF4y2Ba
1gydF4y2Ba
zgydF4y2Ba
′gydF4y2Ba
′gydF4y2Ba
→gydF4y2Ba
。gydF4y2Ba
在本部分中,输入一个数据集包括6-dimensional关节空间采样数据点,轨迹和输出是一个GP模型的潜在空间。给定一个查询点(通常一个时间点),该模型的输出,这是(gydF4y2Ba
19gydF4y2Ba)和(gydF4y2Ba
20.gydF4y2Ba),对应的数据点的轨迹。gydF4y2Ba
使用下面的方程,我们可以从低维潜在项目的数据空间到原始数据空间:gydF4y2Ba
(21)gydF4y2Ba
θgydF4y2Ba
vgydF4y2Ba
我gydF4y2Ba
=gydF4y2Ba
WgydF4y2Ba
ΦgydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
我gydF4y2Ba
)gydF4y2Ba
。gydF4y2Ba
这些数据将用于机器人学习如何生成所需的运动轨迹。在机器人模仿学习,机器人需要符合记录运动轨迹与模型用于发电机(gydF4y2Ba
16gydF4y2Ba,gydF4y2Ba
40gydF4y2Ba]。拟合过程被认为是学习模式发生器。gydF4y2Ba
在我们的系统中,我们使用动态运动原语(DMP) [gydF4y2Ba
11gydF4y2Ba),提出Ijspeert,模式发生器。gydF4y2Ba
DMP被配置为gydF4y2Ba
(22)gydF4y2Ba
τgydF4y2Ba
zgydF4y2Ba
˙gydF4y2Ba
=gydF4y2Ba
αgydF4y2Ba
zgydF4y2Ba
(gydF4y2Ba
βgydF4y2Ba
zgydF4y2Ba
(gydF4y2Ba
ggydF4y2Ba
- - - - - -gydF4y2Ba
ygydF4y2Ba
)gydF4y2Ba
- - - - - -gydF4y2Ba
zgydF4y2Ba
)gydF4y2Ba
,gydF4y2Ba
τgydF4y2Ba
ygydF4y2Ba
˙gydF4y2Ba
=gydF4y2Ba
zgydF4y2Ba
+gydF4y2Ba
fgydF4y2Ba
。gydF4y2Ba
ggydF4y2Ba
是我们的目标状态,gydF4y2Ba
zgydF4y2Ba
内部状态,gydF4y2Ba
fgydF4y2Ba
RFWR模型,计算记录的动态演示和保证收敛的新生成的轨迹,gydF4y2Ba
ygydF4y2Ba
DMP微分方程生成的位置,然后呢gydF4y2Ba
ygydF4y2Ba
˙gydF4y2Ba
是生成的相应速度。gydF4y2Ba
αgydF4y2Ba
zgydF4y2Ba
,gydF4y2Ba
βgydF4y2Ba
zgydF4y2Ba
,gydF4y2Ba
τgydF4y2Ba
这个方程的常数。gydF4y2Ba
拟合(或学习)是训练机器人学习模型:gydF4y2Ba
(23)gydF4y2Ba
fgydF4y2Ba
=gydF4y2Ba
∑gydF4y2Ba
我gydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
NgydF4y2Ba
ΨgydF4y2Ba
我gydF4y2Ba
wgydF4y2Ba
我gydF4y2Ba
vgydF4y2Ba
∑gydF4y2Ba
我gydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
NgydF4y2Ba
ΨgydF4y2Ba
我gydF4y2Ba
。gydF4y2Ba
和gydF4y2Ba
vgydF4y2Ba
满足以下方程:gydF4y2Ba
(24)gydF4y2Ba
τgydF4y2Ba
vgydF4y2Ba
˙gydF4y2Ba
=gydF4y2Ba
αgydF4y2Ba
zgydF4y2Ba
(gydF4y2Ba
βgydF4y2Ba
zgydF4y2Ba
(gydF4y2Ba
ggydF4y2Ba
- - - - - -gydF4y2Ba
xgydF4y2Ba
)gydF4y2Ba
- - - - - -gydF4y2Ba
vgydF4y2Ba
)gydF4y2Ba
,gydF4y2Ba
xgydF4y2Ba
˙gydF4y2Ba
=gydF4y2Ba
vgydF4y2Ba
。gydF4y2Ba
ΨgydF4y2Ba
我gydF4y2Ba
是接受基函数,它在空间分布:gydF4y2Ba
(25)gydF4y2Ba
ΨgydF4y2Ba
我gydF4y2Ba
=gydF4y2Ba
经验值gydF4y2Ba
gydF4y2Ba
(gydF4y2Ba
1gydF4y2Ba
- - - - - -gydF4y2Ba
2gydF4y2Ba
hgydF4y2Ba
我gydF4y2Ba
2gydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
- - - - - -gydF4y2Ba
cgydF4y2Ba
我gydF4y2Ba
)gydF4y2Ba
2gydF4y2Ba
)gydF4y2Ba
。gydF4y2Ba
cgydF4y2Ba
我gydF4y2Ba
基函数的中心,分布在空间,然后呢gydF4y2Ba
hgydF4y2Ba
我gydF4y2Ba
是带宽。gydF4y2Ba
目标是使用采样点gydF4y2Ba
xgydF4y2Ba
和使用机器人迭代学习方法适应参数gydF4y2Ba
wgydF4y2Ba
我gydF4y2Ba
。在学习后,参数是固定的,不需要改变在生成阶段:gydF4y2Ba
(26)gydF4y2Ba
ΔgydF4y2Ba
我gydF4y2Ba
(gydF4y2Ba
ngydF4y2Ba
+gydF4y2Ba
1gydF4y2Ba
)gydF4y2Ba
=gydF4y2Ba
经验值gydF4y2Ba
gydF4y2Ba
(gydF4y2Ba
- - - - - -gydF4y2Ba
1gydF4y2Ba
2gydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
(gydF4y2Ba
ngydF4y2Ba
+gydF4y2Ba
1gydF4y2Ba
)gydF4y2Ba
- - - - - -gydF4y2Ba
cgydF4y2Ba
我gydF4y2Ba
)gydF4y2Ba
TgydF4y2Ba
DgydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
(gydF4y2Ba
ngydF4y2Ba
+gydF4y2Ba
1gydF4y2Ba
)gydF4y2Ba
- - - - - -gydF4y2Ba
cgydF4y2Ba
我gydF4y2Ba
)gydF4y2Ba
)gydF4y2Ba
,gydF4y2Ba
wgydF4y2Ba
我gydF4y2Ba
(gydF4y2Ba
ngydF4y2Ba
+gydF4y2Ba
1gydF4y2Ba
)gydF4y2Ba
=gydF4y2Ba
λgydF4y2Ba
wgydF4y2Ba
我gydF4y2Ba
(gydF4y2Ba
ngydF4y2Ba
)gydF4y2Ba
+gydF4y2Ba
ΔgydF4y2Ba
我gydF4y2Ba
(gydF4y2Ba
ngydF4y2Ba
+gydF4y2Ba
1gydF4y2Ba
)gydF4y2Ba
,gydF4y2Ba
下标gydF4y2Ba
(gydF4y2Ba
ngydF4y2Ba
+gydF4y2Ba
1gydF4y2Ba
)gydF4y2Ba
表示这是gydF4y2Ba
(gydF4y2Ba
ngydF4y2Ba
+gydF4y2Ba
1gydF4y2Ba
)gydF4y2Ba
迭代,gydF4y2Ba
xgydF4y2Ba
(gydF4y2Ba
ngydF4y2Ba
+gydF4y2Ba
1gydF4y2Ba
)gydF4y2Ba
是用于更新的数据点的模型吗gydF4y2Ba
(gydF4y2Ba
ngydF4y2Ba
+gydF4y2Ba
1gydF4y2Ba
)gydF4y2Ba
迭代,gydF4y2Ba
ΔgydF4y2Ba
我gydF4y2Ba
(gydF4y2Ba
ngydF4y2Ba
+gydF4y2Ba
1gydF4y2Ba
)gydF4y2Ba
计算数据点之间的加权距离吗gydF4y2Ba
xgydF4y2Ba
(gydF4y2Ba
ngydF4y2Ba
+gydF4y2Ba
1gydF4y2Ba
)gydF4y2Ba
基函数的中心,用于更新重量gydF4y2Ba
wgydF4y2Ba
我gydF4y2Ba
。gydF4y2Ba