SP
科学的规划
1875 - 919 x
1058 - 9244
Hindawi
10.1155 / 2020/6349342
6349342
研究文章
部分观察家Crane-Robot行动决策过程模型
https://orcid.org/0000 - 0003 - 0509 - 589 x
汗
阿西夫
1
https://orcid.org/0000 - 0003 - 2192 - 1450
李
剑平
1
https://orcid.org/0000 - 0002 - 7774 - 5604
哈克
阿明ul
1
https://orcid.org/0000 - 0003 - 0126 - 9944
纳齐尔
沙阿
2
艾哈迈德
Naeem
3
Varish
诺萨德
4
马利克
阿萨德
5
https://orcid.org/0000 - 0002 - 3444 - 2179
帕特尔
至今为止H。
6
阿里
拉赫曼
1
计算机科学与工程学院
中国电子科技大学(电子)
成都611731
中国
uestc.edu.cn
2
计算机科学部门
Sawabi大学
15
肃贪会
巴基斯坦
3
学校计算机应用
Madanapalle理工学院和科学
Madanapalle
印度
mits.ac.in
4
计算机科学与工程
Koneru Lakshmaiah教育基金会
KL大学
托尔
印度
kluniversity.in
5
信息科学与技术学院
西南交通大学
成都611756
中国
swjtu.edu.cn
6
(RISC)跨学科机器人、智能传感与控制实验室
计算机科学与工程系
布里奇波特大学工程学院
布里奇波特
CT
美国
bridgeport.edu
2020年
28
2
2020年
2020年
01
12
2019年
27
12
2019年
28
2
2020年
2020年
版权©2020阿西夫•汗等。
这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。
最常见的使用机器人是有效地减少人类的努力与理想的输出。在人机交互中,至关重要的是双方的预测随后的行为基于他们现在的行为,完成合作工作。花费大量的精力以达到人类和机器人之间的合作。在决策的情况下,从先前的研究中观察到的是短期或中期预测有长时间范围调整和作出反应。为了解决这个问题,我们提出了一个新的交互模型建立。建议模型减少了错误放大问题通过应用之前的输入通过他们的特性,由深收回信念网络(DBN)虽然玻耳兹曼机(BM)机制。另外,我们提供一个机制来决定可能的结果(接受或拒绝)。该机制评价模型在多个数据集。因此,该系统能够捕获相关信息使用的运动对象。验证和更新这些信息,跟踪,收购,和提取的图像以适应形势。 Furthermore, we have suggested an intelligent purifier filter (IPF) and learning algorithm based on vision theories in order to make the proposed approach stronger. Experiments show the higher performance of the proposed model compared to the state-of-the-art methods.
中国国家自然科学基金
61370073
国家高技术研究发展计划
2007年aa01z423
四川省科技部门
1。介绍
环境感知和对象识别是图像处理的一个重要组成部分。它可以广泛应用于机器人视觉、视频监控、异常处理、智能预警和快速检索和高效的图像存储,相机,等领域。人类很容易感知复杂的场景和响应得到目标对象的位置和类型正确,但目前对机器人视觉理解这是一个具有挑战性的问题。
人眼捕捉最好也有能力帮助神经元在过滤。人类运动预测是预测后续运动系列根据给定的运动序列。通过观察目标对象的运动行为,运动特征提取,然后运动预测终于意识到。直到现在,处理软件盗版或不盗版还成为一个具有挑战性的任务
1]。通过观察人类可以实现这样的预测,这体现了人类的智能推理能力(图
1)。在一些敏感场景对象完全是未知的(加密)的观察者和对象必须被识别加密形式,思想需要添加在未来努力提高观察者的能力在加密域(
2,
3]。
图1
机器人与人类现实世界的观察。
机器人或交互的交互能力变得尤其人-机观察物体的运动的关键。在这种背景下,一个对象可能不同方向和规模或甚至可能部分阻塞。但是,这并不总是影响我们认识它的能力。由于缺乏理想的平台,从一个复杂的场景,获得位置和目标对象精确复杂的任务的机器或机器人与人类相比。计算机辅助预测系统扮演重要的角色,协助任何观察者识别(
4]。协助任何观察者,选择特性可能是冗余的变量必须处理(
5]。选择最合适的组件对整个机器的成功是至关重要的。然而,关于软件组件的可重用性的决定通常是在一个特设的方式,最终导致进度延迟,降低整个质量体系(
6]。
由机器人视觉识别是一项艰巨的和具有挑战性的问题预测复杂的一个重要组成部分,非结构化,和任意场景;也很难平衡,并将算法的输出和识别已知目标的影响。视觉场景相互作用在不同的地形组合,即。,the一个rr一个ngement of the physical characteristics of a region, and adaptive system design is difficult to enhance understanding of the impact of natural scenes in complex environments.
因此,自然环境的发展,图像处理,计算机视觉是专注于视觉感知和面临巨大挑战。视觉感知系统是高度非线性动态系统级神经信息的收集。为存储和理解过程中,视觉注意力结构视觉感知起着重要的作用。等决策软件胎记是一个独特的质量检测软件盗窃(
7]。当地视觉解释信息和可用的计算资源集中在最重要的证据,使得视觉感知的实时,可定制的动态感知现实世界。
每一个生物都有行动模式根据他们的本性,但是对于机器有需要相应的项目工作。从我们家到大的行业,有很多的机器人应用程序可以找到像吸尘器一样,无人驾驶车辆和不同类型的工业机器人。在这种类型的机器人,大脑和视觉的工作非常类似于人类的大脑和眼睛的控制。
大量的研究和开发部门的努力正在取得在世界各地寻找这个问题的解决方案(
8]。视觉能力知觉和传感是一个真正的现象对于了解移动和操纵现实世界是随机的情况。在很多情况下,很难获得足够的图像对象,使对象识别和身份验证困难。与高维小样本问题是最近一个热门项目。在传统的对象数据库中,图像的数量是有限的。
这项研究的目标是鼓励通过神经网络认知智力和自适应自然场景识别技术,可以提高自然场景的理解,针对对象,和解决的多样性、随机性,复杂自然场景和其他问题,使实时视觉系统高度灵活。它是提供一个稳定的矿业的实际应用的基础。自然复杂环境和复杂的场景多样化如图
2演示了如何克服缺乏视觉处理系统的随机性。
图2
实时视觉系统。
例如,生物视觉模型(BVM)致力于提供新的技术方法代表合并新的认知视觉期货与认知智力皮层神经细胞的启发,试图联系现实世界的对象识别。感知任意复杂自然场景环境感知和遥感机器人移动和操纵自然场景理解是一个非结构化随机视觉成像和处理富有挑战性的问题
9]。
神经网络是一个地图的“神经元”节点;在这篇文章中,我们将神经网络(NN)只是一个例子,致力于做出贡献的新技术概念场景理解和承认通过重新组织新的视觉知识特征场景表达,这可能非常重要,并提供机器人视觉与知觉情报。这种方法不仅让系统继续还提供学习在自然场景和复杂环境的感知与理解。通过感知能力的研究自然场景图像从复杂的环境中,机器人视觉增强认知视觉功能的集成和现场表达(
10]。
我们的贡献总结如下:
(我)
我们提高捕获的效率,代表视觉图像的目标特性和改善自然环境的特征表示,这样系统可以智能地观察无组织的自然场景。
(2)
我们提出了一个模型,该模型可以通过至关重要,一般测量能力技能智能信息检索系统建立的方法,分析和提炼是一个突破提供更好的视觉信息情报。
(3)
我们建议的模型继承了一种新的智能净化器过滤处理方案,升级的仿生图像处理。
(iv)
该模型本质上是受复杂的BM(玻耳兹曼机)场景预测视觉信息处理机制,这是获得更好的感知决策性能专家与深刻的信念网络。我们在选择数据集提供了相当多的经验观察结果的支持。
本文的其余部分组织如下。节
2,我们概述动机的相关工作的原因我们的工作。部分
3覆盖该部分观察家决策过程模型,进一步描述了两个部分:首先是获取可能的感知做出下一步决定与深层信念网络,其次是学习决定进一步行动的滤波器分析包含在学习算法。节
4,卓越的性能表现在实验仿真和其结果。最后,在节
5,我们得出的结论提出分析与未来的接受。
2。相关工作
研究表明,(
11从两个方面影响视觉注意力的因素,即。,top-down prior knowledge and input signal, make the sensor stimulus from bottom to up. Among them, the top-down prior knowledge and applications are highly correlated, which is very tough for modeling analysis. Therefore, there are lot of sensor stimulations only for the Bottom-up visual attention model. The paradigm of bottom-up visual attention can be classified into two categories [
12]。一个是使用眼动跟踪眼睛看图像的位置和使用统计方法来让眼睛区域看起来长和人类关心的一个重要区域。另一个类别是由多通道输入图像的多尺度分析定义的,统计上显著的利息在图像每个像素的程度取决于提取分布。
首先基于显著分布地图的视觉注意力模型已经提出的科赫和Ullman [
13]。在此之前,已经有许多视觉注意力模型基于显著分布(
13- - - - - -
17]。但是没有模型使用一个兼容的系统对于复杂的领域知识像人类的眼睛。同样的不涉及人类的眼睛凝视输入图像和注视时间静态显示重复测试的数量是人类和我们一样愉快。有许多领域空间目标探测(
11,
18,
19),视频压缩和编码(
20.,
21),图像分析(
22,
23)和场景理解(
24]。这些模型将被应用。和其他领域可以使用内存有限的计算资源来处理输入视频图像或该地区人类视觉的最感兴趣的。
因此,没有减少干预的效率概念,系统不仅减少了空间开销,也会增加系统的性能在许多方面,如处理个人视觉的效果需要更重要的是,一个更强大的噪声鲁棒性增加了稳定在复杂背景,等等(
11,
18,
19,
22- - - - - -
25]。此外,这些模型需要计算高斯金字塔输入图像的多尺度和多通道特性和计算这些可观的股息支付样品成一个全球重要的分布,使用赢者通吃(WTA)机制独立选择最重要的区域(
24]。
整个过程需要大量的中间结果,可以存储和有一个更大数量的计算,使它更加难以在嵌入式系统中实现有限的计算资源。生物科学实验证实灵长类动物大脑的颞叶皮层的神经细胞活动和动物识别对象是密切相关的
25]。当对比与通用的图像模型存储在大脑中,特定对象的重组可以理解。研究人员因此得出结论,一个可行的方法是模拟视觉皮层结构来构造对象识别。
最早的灵长类动物相关视觉系统模型是neocognitron模型(
26),这是基于自组织的前馈神经网络。英国沃利斯和卷牛津大学的实验心理学部门促进了恒定的目标识别VisNet灵长类动物模型(
27)和改进版本称为Visnet2 (
28]。这是一个四层前馈、收敛和竞争性质的网络,每一层都汇集了前一小部分细胞层的输入字段(称为过滤器)。这种聚合法律,灵长类动物视觉皮层细胞感受野特性的大小增加模拟从初级到高级的水平。梅尔1997年SEEMORE模型,它也是一个前馈层次结构模型,利用颜色、形状和纹理组合来实现视觉物体识别。SEEMORE使用多级组合特性来提高识别的鲁棒性。Serre等人在2005年和2007年HMAX模型应用于目标识别;改进的模型构造高层模拟生物的视觉特性。视觉特征层次结构的模板是一个操作对象识别的匹配和融合,在连续模拟用于规模不变,翻译,在视觉皮层和旋转。很多研究人员在这个领域做出突出贡献。
我们建议的模型有两个方面。(a),它提供了一个集成的智能平台的特性和预处理来预测未来的预测。我们分析玻耳兹曼机机制(
29日),其结果经过第二阶段的净化器智能过滤器,这是受生物视觉模型来净化,段,并识别对象,这使得该模型简单、高效。(b)第二个方面涵盖了决定模型包含基于准确的感知结果,和合作伙伴可以相互合作得更好。这就要求观察者有能力识别和估计运动序列(
30.,
31日]。
3所示。部分观察家决策过程
为行动提供视觉智能,机器人需要虽然学习任务的步骤,而新算法提出了解决一系列相关要求在视觉信息处理系统理论问题。探索提供新的可见性知觉的固有特性,如多样性、随机性,在实时复杂的自然环境和复杂性,适应网络感知能力的自然场景图像的结合,从而提高其认知视觉特性和现场的表情。
感知层次模型的结果直接结合和传感对象参与决策模型。行动模型可以同时记住多个目标,不仅仅是为了一个共同的目标更好的分类,而且质地,非刚性的目标分类。该模型主要基于视觉计算模拟计算皮质行动(任务)的网络层次结构。观察的过程模型可以很容易地理解数字
3。
图3
观察员预测和决策的过程。
预测信息<我t一个l我c>C动态对象在复杂的环境中利用视觉信息和预测,典型的表单输入方法(<我t一个l我c>一个,<我nline-formula>
X
^
)/输出(<我t一个l我c>B,<我nline-formula>
Y
^
)关系如下,
(1)
f
0
C
x
y
=
一个
,
为
f
我
x
^
,
y
^
≤
t
,
B
,
为
f
我
x
^
,
y
^
>
t
,
在哪里<我t一个l我c>t阈值和吗<我t一个l我c>f分别是输入/输出图像功能。它是充足的目标及其实现明显对比的背景。视觉源系统使一个复杂的环境中处理。在这个过程中,视觉反馈不断跟着看到每一帧的模板匹配对象的动态信息和预测位置提取。当两物体间平方误差之和小于捕获的图像和BM结果在预先确定的阈值,那么我们可以说对象找到了一个我们正在寻找
32]。
3.1。感知决策
玻耳兹曼机(BM)机制是一个变种的传感和知觉预测结果。BM是一种非线性时间序列生成模型,它使用一个无向的模型与二进制潜变量,<我t一个l我c>h连接到可见的变量的集合,<我nline-formula>
v
。在每个时间步<我t一个l我c>t,<我nline-formula>
v
和<我t一个l我c>h从可见接收指示连接变量在最后<我t一个l我c>N时间步长,<我t一个l我c>N是时间窗口的大小。“历史”向量或知识数据由数据连接<我nline-formula>
t
−
1
,<我nline-formula>
t
−
2
、…<我nline-formula>
t
−
N
,我们称之为<我nline-formula>
v
<
t
。MB的模型定义了一个联合概率分布<我nline-formula>
v
t
和<我nline-formula>
h
t
条件,如公式(3)所示<我nline-formula>
t
≥
v
:
(2)
Z
v
t
,
h
t
v
<
t
=
−
∑
j
v
j
,
t
X
^
j
,
t
−
∑
我
h
我
,
t
Y
^
我
,
t
−
ρ
,
在哪里
(3)
X
^
j
,
t
=
b
v
j
+
∑
k
X
k
j
v
k
,
<
t
,
Y
^
我
,
t
=
b
h
我
+
∑
k
Y
k
我
v
k
,
<
t
,
在哪里
(4)
P
v
t
,
h
t
v
<
t
,
θ
=
经验值
−
Z
v
t
,
h
t
v
<
t
,
θ
E
v
<
t
,
在哪里<我nline-formula>
E
v
<
t
是一个常数叫做配分函数和<我nline-formula>
X
^
t
和<我nline-formula>
Y
^
t
准时是动态的偏见吗<我t一个l我c>t,从过去表达输入可见光和隐藏单位的视觉资源(方程(
2)和(
4))。
玻耳兹曼机也可以归类为训练生成学习目标,内部实体,如相机遵循这个跟踪,运动,和控制。学习的联合分布<我nline-formula>
p
v
,
y
的输入向量<我nline-formula>
v
和目标类<我t一个l我c>y和/或歧视的学习目标和学习的条件分布<我nline-formula>
p
y
v
直接是必要的。它不需要额外的培训阶段对于传统的玻耳兹曼机这样的分类器。大英博物馆的能量函数所示以下方程:
(5)
Z
y
,
v
,
h
=
−
b
T
v
−
c
T
h
−
d
T
e
y
−
h
T
U
e
y
−
W
v
,
与参数<我nline-formula>
ρ
=
b
,
c
,
d
,
W
,
U
在哪里<我nline-formula>
v
输入向量和吗<我t一个l我c>y是第一个类标签的过程。实现区分目标,大英博物馆的后验概率可以推断从以下方程:
(6)
P
y
v
=
经验值
−
Z
v
,
y
∑
经验值
−
Z
v
,
y
∗
。
分母总结所有标签<我nline-formula>
y
∗
为了使<我nline-formula>
P
y
−
v
一个概率分布。BM只能做分类任务的独立样本除了时间序列之间的关系;时间序列的样本彼此之间相互依赖,可以影响和成功样本。
我们的模型的主要目的,这主要是基于BM,是抑制误差放大问题,延长长度知觉。从分析这部分区域,我们可以得出结论,在知觉使BM低效的问题主要来自两个方面:第一个是以前的过去的结果直接作为输入数据,第二个是没有限制目前的结果。在我们的工作中,我们应该避免过去的预测结果直接输入数据;与此同时,我们也应该降低知觉比(
9]。
我们检索功能决定使用BN过去<我t一个l我c>N时间步长和歧视的类标签相应的预测结果来决定是否接受它。模型的结构如图
3。
3.1.1。深度信念网络
我们已经训练模型后,我们可以添加层DBN(图
4)。前面的步骤都连接到每个隐层和一个独立的权重矩阵。下一阶段将先前隐藏状态向量的“观察或预测”数据。两级模型如图
4。
图4
深度信念网络。
3.2。决定采取行动
智能净化器过滤(IPF),视觉范式的理解,和解释完全取决于一个智能处理现实世界的视觉之间的关系作为输入和处理输出,使机器能够看到和理解。原始层和比较层集成所有视觉处理特性和图像的预处理,分析变得更容易。现在不同的工作环境也维持一个庞大的数据库复杂世界的对象,所以通过这个模型中,我们试图分析对象代表它们的预处理和特征如图
5。模型目标层能够进行智能识别,与人工观测方法,这种可能性的原因的第二阶段提出了机器人视觉模型降低复杂性为下一步预测准确。每层由不同的单元类型和使用前面的输出作为输入。(一)第一层使用基本规模图像作为输入,输出和最后一层是可以应用于类的特征值识别。随着时间,字段的大小增加和复杂性成为进步的感受。(b)顶级视觉区域的复杂性是建立由下层的步骤,有一些冗余。(c)在这个模型,高斯金字塔的净化过滤器根据输入动态对象或现实世界周围的亮度,计算颜色、方向,该频道的多尺度特征。它会导致大量的计算和存储下一个随机抽样的过程。一些其他人取代在决定组合和规范化与当地的极端主义方法,迭代法或先验知识的方法。
图5
极好地集成智能净化器过滤。
狗可以描述为滤波函数
(7)
D
o
G
年代
,
我
c
我
=
G
σ
年代
我
−
我
c
−
G
年代
⋅
σ
年代
我
−
我
c
,
(8)
G
σ
年代
我
=
1
2
λ
⋅
σ
年代
2
⋅
e
1
2
⋅
σ
年代
。
根据方程(8),很明显,在二维高斯函数与方程(
8)方差<我nline-formula>
σ
&
这取决于规模<我nline-formula>
年代
1
中心位置的位置吗<我nline-formula>
我
c
光感受器的过滤器。
然后,计算细胞的激活点积见以下方程:
(9)
我
,
ϕ
1
=
x
=
∑
我
=
R
我
l
。
ϕ
1
l
。
在这里,<我nline-formula>
ϕ
1
过滤器的重量,我是各自区域的神经元<我t一个l我c>R的强度<我nline-formula>
我
l
。所以,马克斯操作后,响应的复杂的单位<我nline-formula>
C
1
是
(10)
r
=
马克斯
x
j
,
j
=
1、2、3
,
…
,
米
。
所以,精确定时通过强度表示为动作电位
(11)
T
我
=
f
年代
我
=
T
马克斯
−
日志
β
年代
我
+
1
。
显示为一个像素<我nline-formula>
年代
1
,有鳞的因素<我t一个l我c>βesocdy windows的最长时间<我t一个l我c>T马克斯 。
存在每一个细胞计数与不同的振荡(阈下膜振荡)。因此,它被描述为
(12)
OSC
我
=
因为
ω
T
+
ϕ
。
周期的数量<我t一个l我c>W和初始阶段<我t一个l我c>我像素是
(13)
ϕ
1
=
ϕ
0
+
我
−
1
⋅
d
ϕ
。
转换后的强度值,方程(
13)一行行动,实现的算法操作的所有步骤执行关系信息。
所以,学习执行检索相关测量采用期望之间的相似度<我nline-formula>
d
和实际o / p。因此,矩阵时代
(14)
C
=
V
⟶
d
⋅
V
⟶
一个
V
⟶
d
⋅
V
⟶
一个
。
学习信息后,我们做出决定的相关性<我t一个l我c>C之间所需的o / p和实际o / p,所以目标模式认为封闭<我t一个l我c>C。
作者认为,由于概率预测和传感技术,理想的(图
6)解决方案提供了基本方法扩展硬件系统的能力超出了当前使用的观察提供的边界处理方法(如图
7)。在我们看来,介绍了方法的应用程序(特别是新DBN,净化器过滤,和获得的数据集表示算法
1)导致有效改善结果,至少在使用以下的情况。
图6
观察者决策过程及其部分任务分析。
图7
感知和决策模型下行动。
<大胆>算法1:< /大胆>观察者参数学习。
输入 :动态输入坐标<我nline-formula>
x
t
,
y
t
;
隐藏的表示时间<我nline-formula>
t
+
1
:<我nline-formula>
X
t
+
1
;
类标签<我t一个l我c>t:<我nline-formula>
Y
t
;
输出 :预测<我nline-formula>
t
+
1
:<我nline-formula>
x
t
+
1
;
(1)
步骤1:初始化
(2)
做
(3)
计算隐藏表示<我nline-formula>
t
+
1
:
(4)
计算可见表示<我nline-formula>
t
+
1
:
(5)
计算预测的类标签<我nline-formula>
t
+
1
:
(6)
而
Y
t
+
1
=
=
Y
t
;
(7)
调整初始输入值<我nline-formula>
x
t
随机。
(8)
返回
Y
t
+
1
;
4所示。实验装置和结果
后、运动和控制是至关重要的一个描述了机器人像起重机与手机等便携设备传感器安排相应的对象与武器和机载相机,可见设备能够位置可控的世界舞台。所以这些真正的探索性方法巩固的算法编码MATLAB (
32)和信号活动执行控制和过程(图
8)。action-3D数据库是一种motion-action行为数据集。这个数据集被一种力量相机。有23种行为数据集,即向后移动,完善,move-jump,向上,向下,手臂高,水平臂,锤子,手抓,扔,画圆,两个手移动,一边移动,移动,角色,左移,右移,捡起,扔。每个动作重复了两次由10个科目;因此,有30个序列数据集,每个操作的,总共有600个序列。采样频率是每秒15倍,每一帧的决议<我nline-formula>
640年
∗
480年
。
图8
实验设置。
4.1。仿真结果
我们验证了我们的模型的性能在IPF动态观察数据集。动态观察检索数据从一个摄像机。有两类数据集(如表所示
1和图
9)。一个是“向前走”,表演者指向的地方没有,另一个是“向后走,”,表演者步骤尝试保存对象(如表所示
2和图
10)。总共有200年的时间序列数据。我们选择150系列作为训练数据,其余正在测试数据。每个系列都包含150帧,每一帧是单变量。我们代表了一系列的矩阵,每一行代表一个单一的运动。数据的预处理是一个很好的表示数据的必要步骤和机器学习
33]。我们展示了两种类型的曲线图形输出(图
11)。左边的一个是“向前走”类,右边的一个是“向后行走”类。然后,我们把整个系统掌握目标对象在特定目的地和替换在最后的行动(如表所示
3和图
12)。我们把每一个时间序列作为一个批处理,这意味着有150批次,当训练。我们首先验证大英博物馆和一个浅的结构。我们隐藏单位数字显示的结果不同,不同prestep数字,和不同的学习速率图
13和表
4。因为没有理论如何设置隐藏的单元号,prestep号码,和学习速率,我们选择根均方误差(RMSE),平均绝对百分比误差(日军)和平均相对误差(绝笔)作为标准。我们发现当prestep数字5和学习速率为0.01,200次迭代后,隐藏的单元号是200,可以获得相对较小的RMSE值,梅,绝笔。除了隐藏的单元号,我们进行了几个实验不同prestep数字,我们发现增加prestep数字不能进一步提高预测的性能。
表1
向前走表。
步骤/计数(10)
步骤/ count (50)
8.5236
31.3214
8.0325
28.8976
7.3178
26.7849
7.4592
24.8934
8.1562
21.2123
图9
步行(向前)表的比例。
表2
向后走表。
步骤/计数(10)
步骤/ count (50)
8.8756
36.2543
8.9546
29.6435
7.1289
28.7543
8.1136
26.1235
8.0128
22.8456
图10
步行(向后)表的比例。
图11
LR /胡后部分观察分析和结果。
表3
传感器和表。
步骤/计数(10)
步骤/ count (50)
9.0273
33.3423
8.4236
30.8745
8.2684
27.6715
7.9214
26.9452
7.1029
21.1579
图12
比(皮卡和)表。
图13
LR /胡观察者预测。
表4
LR /胡锦涛表。
学习速率
隐藏的单位
0.1
One hundred.
0.0712
0.0801
10.0618
11.0398
0.1322
0.5721
0.01
200年
0.0765
0.0712
9.9589
9.0286
0.1159
0.4678
表中的值
4表明,当隐藏单位的数量是200,相对较小的值可以获得的三个标准。因此,在接下来的实验中,我们隐藏单位的数量设置为200,上一步学习速率为0.01,数量为5。
4.2。结果分析
因为原始数据集深度高噪声的图像,图片太模糊,其他的缺点;因此,本文使用跟踪算法来提取图像的实时3 d联合立场,最后结合3 d数据集向量。因为数据集对象的运动实际上是3 d立体运动,我们将三维向量转换为一个二维向量来表达原来的运动。
4.2.1。准备比较
基于实验基地工作的结果(数据
14和
15)[
32),根据该模型的结果(在图
11、表
4,图
13)设置层2,前面输入步骤5,隐藏的单元数为200层1和100层2,和学习速率是0.01。我们训练的模型500时代。我们将数据集划分为批次。每一批包含100个样本。每一批后的参数更新。描述模型的感情,我们随机选择了一个序列forward-move-action和第一个5帧输入我们的模型生成以下25帧,希望该模型能产生剩余的正确动作。从分析图形,第一个预测这些模型都非常接近目标。
图14
部分观察分析和结果。
图15
PDF结果比率。
5。结论
这种技术提供了一种简单、高效的方法建立决策和行动相比与传统或传统。然而,性能可能受到硬件的限制,如模型的体系结构和决策所需的处理。可接受的实证结果取得了使用该策略。根据结果,前输入和当代决定输出的数量大大影响性能。我们研究的下一步将如何改变之前的许多步骤输入和多少单位应在隐藏层产生高质量的效果。我们还将继续改进算法来提高预测准确性的练习。我们正考虑到快速行动处理和运动估计作为我们的未来的工作。
数据可用性
使用的数据来支持本研究的结果包括在本文中。
的利益冲突
作者宣称没有利益冲突。
确认
这项工作得到了国家自然科学基金(批准号61370073),中国国家高技术研究发展计划(批准号2007 aa01z423),该项目四川省科学技术厅。资源用于实验的支持都是由重点实验室给出小波活跃的媒体技术学院的计算机科学、中国电子科技大学(电子),2006号,西苑大道,西高新技术区,成都,四川,611731,p . r .中国。
[
]1
纳齐尔
年代。
沙赫扎德
年代。
丽
l S。
Birthmark-based软件使用粗糙集分类
阿拉伯科学与工程》杂志上
2017年
42
2
859年
871年
10.1007 / s13369 - 016 - 2371 - 4
2 - s2.0 - 85012113185
[
]2
马利克
一个。
王
H。
吴
H。
阿卜杜拉希
s M。
可逆数据隐藏与多个数据为多个用户在一个加密的图像
国际期刊的数字犯罪和取证
2019年
11
1
46
61年
10.4018 / ijdcf.2019010104
2 - s2.0 - 85054330830
[
]3
马利克
一个。
王
H。
陈
T。
可逆数据隐藏在homomorphically加密图像使用插值技术
《信息安全与应用程序
2019年
48
102374年
10.1016 / j.jisa.2019.102374
2 - s2.0 - 85071026740
[
]4
哈克
答:U。
李
j . P。
Memon
m . H。
特征选择基于L1-norm支持向量机和帕金森病有效的识别系统使用语音录音
IEEE访问
2019年
7
37718年
37734年
10.1109 / access.2019.2906350
2 - s2.0 - 85065204020
[
]5
哈奇
一个。
李
J。
Memon
m . H。
汗
J。
Ud喧嚣
年代。
一种新颖的集成诊断乳腺癌检测的方法
《智能与模糊系统
2019年
1
16
10.3233 /出售jif - 191461
[
]6
纳齐尔
年代。
安瓦尔
年代。
汗
美国一个。
软件组件选择使用网络分析法基于质量标准
抽象和应用分析
2014年
2014年
12
535970年
10.1155 / 2014/535970
2 - s2.0 - 84934983125
[
]7
纳齐尔
年代。
沙赫扎德
年代。
汗
美国一个。
宾蒂别名
N。
安瓦尔
年代。
一种新颖的基于规则的方法估算软件胎记
科学世界日报
2015年
2015年
8
579390年
10.1155 / 2015/579390
2 - s2.0 - 84928485359
[
]8
纳齐尔
年代。
沙赫扎德
年代。
:
r B。
法曼
H。
评估软件的基于特征的胎记
集群计算
2018年
21
1
333年
346年
10.1007 / s10586 - 017 - 0842 - 3
2 - s2.0 - 85017105985
[
]9
夏
l
Lv
J。
刘
D。
动议通过变形的代码集成分类模型与改进的健壮性
神经计算和应用
2019年
31日
12
8519年
8532年
10.1007 / s00521 - 018 - 3681 - 0
2 - s2.0 - 85053895156
[
]10
汗
一个。
深
年代。
李
j。
库马尔
K。
谢赫
r。
哈桑
F。
视觉理解与cbir云无袖长衫
国际计算机学报2014年11日会议上小波Actiev媒体技术和信息处理(ICCWAMTIP)
2014年12月
成都,中国
IEEE
293年
296年
10.1109 / iccwamtip.2014.7073411
2 - s2.0 - 84946690288
[
]11
Itti
l
科赫
C。
saliency-based搜索公开的和隐蔽的视觉注意力的转移的机制
视觉研究
2000年
40
10 - 12
1489年
1506年
10.1016 / s0042 - 6989 (99) 00163 - 7
2 - s2.0 - 0034003645
[
]12
勒穆尔
O。
Le荡妇
P。
胡须
D。
梭罗
D。
一个连贯的自底向上的视觉注意模型的计算方法
IEEE模式分析与机器智能
2006年
28
5
802年
817年
10.1109 / tpami.2006.86
2 - s2.0 - 33645236179
[
]13
科赫
C。
Ullman
年代。
选择性视觉注意的变化:对潜在的神经回路
重要的情报
1987年
柏林,德国
施普林格
115年
141年
10.1007 / 978 - 94 - 009 - 3833 - 5 - _5
[
]14
Itti
l
科赫
C。
Niebur
E。
saliency-based视觉注意力模型的快速场景分析
IEEE模式分析与机器智能
1998年
20.
11
1254年
1259年
10.1109/34.730558
2 - s2.0 - 0032204063
[
]15
沃尔特
D。
科赫
C。
注意突出proto-objects建模
神经网络
2006年
19
9
1395年
1407年
10.1016 / j.neunet.2006.10.001
2 - s2.0 - 33750684017
[
]16
Kohonen
T。
视觉注意计算模型
4
学报》国际神经网络联合会议,2003
2003年7月
波特兰,或美国
IEEE
3238年
3243年
10.1109 / ijcnn.2003.1224092
[
]17
李
K。
巴克斯顿
H。
冯
J。
Cue-guided搜索:选择性注意的计算模型
IEEE神经网络
2005年
16
4
910年
924年
10.1109 / tnn.2005.851787
2 - s2.0 - 23044451395
[
]18
汉
J。
颜
k . N。
李
M。
张
周宏儒。
无监督提取彩色图像的视觉注意力的对象
IEEE电路和系统视频技术
2006年
16
1
141年
145年
10.1109 / tcsvt.2005.859028
2 - s2.0 - 31644442650
[
]19
陈
Z。
汉
J。
颜
k . N。
动态比特分配多个视频对象编码
IEEE多媒体
2006年
8
6
1117年
1124年
10.1109 / tmm.2006.884633
2 - s2.0 - 33845621068
[
]20.
Itti
l
自动凹形视频压缩使用神经生物学的视觉注意力模型
IEEE图像处理
2004年
13
10
1304年
1318年
10.1109 / tip.2004.834657
2 - s2.0 - 4544260101
[
]21
张
P。
王
R.-S。
基于位置检测凸区域转移和程度跟踪
软件学报
2004年
15
6
891年
898年
[
]22
Privitera
c . M。
斯塔克
l·W。
算法定义视觉感兴趣的:与眼光停留
IEEE模式分析与机器智能
2000年
22
9
970年
982年
10.1109/34.877520
2 - s2.0 - 0034269226
[
]23
Siagian
C。
Itti
l
快速生物启发的场景分类使用功能与视觉注意力
IEEE模式分析与机器智能
2007年
29日
2
300年
312年
10.1109 / tpami.2007.40
2 - s2.0 - 33947236748
[
]24
伯特
P。
阿德尔森
E。
拉普拉斯算子的金字塔图像作为一个紧凑的代码
IEEE通信
1983年
31日
4
532年
540年
10.1109 / tcom.1983.1095851
2 - s2.0 - 0020737631
[
]25
利奥波德
d . A。
Bondar
i V。
Giese
m·A。
Norm-based面临单一神经元编码的猴子inferotemporal皮层
自然
2006年
442年
7102年
572年
575年
10.1038 / nature04951
2 - s2.0 - 33746712905
[
]26
Serre
T。
狼
l
Bileschi
年代。
Riesenhuber
M。
小山
T。
健壮的对象识别与cortex-like机制
IEEE模式分析与机器智能
2007年
29日
3
411年
426年
10.1109 / tpami.2007.56
2 - s2.0 - 33847380121
[
]27
埃文斯
K·K。
-特雷斯曼
一个。
知觉对象的自然场景:这真的是关注自由?
实验心理学杂志》:人类感知和性能
2005年
31日
6
1476年
1492年
10.1037 / 0096 - 1523.31.6.1476
2 - s2.0 - 32644480267
[
]28
卡拉斯科
M。
McElree
B。
丹尼索瓦
K。
佐丹奴
a . M。
视觉处理的速度与偏心率增加
自然神经科学
2003年
6
7
699年
700年
10.1038 / nn1079
2 - s2.0 - 0037743573
[
]29日
Bengio
Y。
人工智能的学习深入架构
机器学习的基础和趋势®
2009年
2
1
1
127年
10.1561 / 2200000006
2 - s2.0 - 69349090197
[
]30.
Simonyan
K。
Zisserman
一个。
二束卷积网络行动识别视频
先进的神经信息处理系统
2014年12月
加拿大蒙特利尔
568年
576年
[
]31日
多纳休
J。
安妮·亨德里克斯
l
Guadarrama
年代。
长期反复卷积网络视觉识别和描述
《IEEE计算机视觉与模式识别会议
2015年6月
波士顿,美国
2625年
2634年
10.1109 / cvpr.2015.7298878
2 - s2.0 - 84959236502
[
]32
汗
一个。
李
j。
马利克
一个。
优素福汗
M。
起初的建立集成机器人控制
软计算和信号处理
2019年
柏林,德国
施普林格
95年
105年
10.1007 / 978 - 981 - 13 - 3393 - 4 - _11
2 - s2.0 - 85062294085
[
]33
哈克
答:U。
李
J。
Memon
m . H。
机器学习分类器的分类性能的比较分析和深层神经网络分类器对帕金森病的预测
学报2018年15日国际计算机会议上小波活跃的媒体技术和信息处理(ICCWAMTIP)
2018年12月
成都,中国
IEEE
101年
106年
10.1109 / iccwamtip.2018.8632613
2 - s2.0 - 85062828705