本研究提出了建设越南语音识别模块和冗余机械手逆运动学控制通过使用人工智能算法。第一个深学习模型是建立识别和语音信息转换成输入信号的6个自由度的机器人机械手逆运动学问题。逆运动学问题是解决基于建设和培训。第二个深学习模型是使用数据确定数学模型的构建系统的几何结构,关节变量的限制和工作区。深度学习模型是建立在PYTHON语言。建立深度学习网络的有效操作演示了人工智能算法的可靠性和适用性越南语音识别模块的各种任务。
近年来,控制系统设计开发了智能控制系统的发展趋势,但仍确保快速和灵活的实时响应不断变化的控制要求和允许高精度人工交互。
在传统的智能控制系统,研究基于语音的控制是吸引许多科学家由于其用户友好交互。工业机器人的语音控制系统中,用户可以有机器人执行各种各样的任务通过简单的命令,携带相关控制信息运动方向和对象的特征。
本质上,使用语音命令的输入控制系统来解决这个问题的逆运动学(反向),然后转化为机械手的各种操作。由于语音指令的不同性质,机械手任务不断变化,要求控制系统要处理迅速做出反应。动力学求解算法等分析方法(
结果最近的人工智能(AI)的研究表明,神经网络(NN),深度学习和强化学习算法是非常有用且有效的处理复杂的非线性问题与成本节约计算时间和系统资源
许多解决方案应用语音控制系统基于人工智能算法对工业机器中提到(
本研究提出了设立两个深度学习网络DL1和DL2处理语音信号的输入6自由度冗余机械手来解决逆向运动控制问题。控制信息的语音标签包括运动的方向和对象的属性在演讲。机器人将会进行图像识别来确定对象都有适当的属性从句子的语音识别结果。图像识别是通过电脑的内置视觉模块,不会深入分析研究。对象的中心坐标将代表机械手的末端执行器位置点需要去。训练数据模型DL2取自正向动力学问题的结果基于运动学建模根据Denavit-Hartenberg (DH)理论。DL网络模型是使用PYTHON语言构建。成功地解决这两个问题有一个广泛的潜在应用,以应对不断变化的轨迹没有预编程序的操纵者。
操纵器接收来自运营商使用语音识别语音命令模块。然后,控制系统自动分析,计算,并给出了控制信号的汽车在机械手的关节(图
语音控制的图6自由度机械臂。
具体来说,语音识别模块将从包含控制信息人的声音转换成文本的程序。机械手控制信息包含在语音信息包括机械手的运动的方向(向左转或向右),机械手需要执行什么操作(抓的动作或下降),识别对象(车轮、托盘、箱等),和特色的对象(颜色、形状、大小等)。
输入语音和输出控制信号必须定义解决机械手控制的目标。从本质上讲,语音识别模块是一个自然语言处理问题,和DL模型是为了网络学习如何将信息从语音到文本。的步骤来执行VCS是描绘在图
的步骤来执行风险投资。
这个问题是通过以下步骤解决:噪音过滤,分离,将声音的振动转换成声能在频域中,DL1和将这种能量转化为输入数据模型。
噪音过滤步骤可以通过许多方法如降噪处理基于接收机的硬件设计麦克风或电子元件电路的记录或计划调整。声音包括的主要预期的声音,我们需要记录和噪音(不必要的声音或无法控制信息)。这些声学噪声可以来自外部环境的声音如交通和工业噪声。他们经常影响语音识别结果的准确性。显著降低音频噪声,降噪收发器是用于这项研究。
每个人的句子通常是由许多词汇的总和。每个词都包含一个或几个音节。因此,语音识别程序必须执行两个基本任务:将单词在句子和分离每个单词的音节。
有趣的是,每一个越南字只有一个音节。因此,本研究只需要关注第一个任务,就是将单词在句子分开。为了更好的理解这个问题,让我们考虑下面的例子。
我们考虑一个越南语音命令来控制机械手:“码头ben phải lấy banh xe茂稳索”(“右转,抓住黄河轮”英语)。注意到,越南的句子有8个音节,而英语有7个音节,“黄色”有两个音节。
通过麦克风和声音接收记录通过常规应用程序无效记录器可以在微软Windows操作系统。音频文件可以读取和写入
声学振荡幅度值归一化,这样输入信号不包含很多suboscillations,使分离过程更高效和容易通过设置一个阈值过滤器。正常化后,这个词分解执行DL1模型与网络节点参数,可以通过调整样本的学习过程来提高精度。
归一化后的声学振荡振幅在图所示
归一化的声音振幅。
然而,应该注意的是,声音波动幅度非常大区域相对于其他领域,而演讲将被视为噪声在演讲。此外,具有小而相当等于振幅振荡区域也被认为是噪声信号,可以忽略。因此,如果一个用户突然尖叫一个词或说所有的话在一个句子在低体积,系统可能不理解语音命令。
声音振动的振幅的变化决定单独的单词使用梯度法[
从方程(
声音的能量这个词“码头”和“Phải”这个词。
声音的一个基本特征是能量价值,用于将输入数据转换为DL模型。考虑到能源的价值在每个频率间隔的声音
张量输入正常化之前和之后。
在构建张量的输入之后,DL1模型是建立多输入和多输出(图
多层人工智能网络(
输入的数量取决于参数的数量在张量输入向量。网络的输出层DL1包括不同的节点,和每一个节点代表一个特定的词。输出单词出现的概率值的范围
层隐藏在DL1模型确定词的概率值产生正确的输出。内的元素
更新DL模型,
在PYTHON中DL1模型。
47行声明了输出层与17个节点将Softmax激活函数。这个输出数字代表17个常用单词的语音命令框架。的
从技术上讲,越南的句子,被分离成单个词后,将根据DL1分类模型,形成一套是必要的单词组合成一个等效完整的文本,自由的噪音和其他多余的单词。这个完整的文本(越南有意义的单词和短语)作为机器学习(ML)模型的输入。
实际上,该算法TF-IDF用于提取文本的特点。然后,朴素贝叶斯算法分类功能文本的词汇和短语属于控制信息层。毫升模型是建立在PYTHON语言结合数学库
真正的六自由度机械臂是呈现在图
真正的六自由度机械臂。
运动学模型。
在运动学模型,固定的全球坐标系统
让我们表示
DH参数。
| 参数 |
|
|
|
|
|---|---|---|---|---|
| 链接1 |
|
|
|
|
| 链接2 |
|
|
|
|
| 链接3 |
|
|
|
|
| 链接4 |
|
|
|
|
| 联系5 |
|
|
|
|
| 链接6 |
|
|
|
|
注意:
齐次变换矩阵
末端执行器的位置和方向相对固定的全球坐标系统由齐次变换矩阵表示
通过应用DH参数方程(
网络DL2模型的数据是末端执行器的空间坐标设置点和相应的关节变量参数的收集和输入训练DL2网络多次,直到模型可以给机械手精确控制信号,满足运动要求。训练后和评估响应性好,DL2模型作为模型来预测机械手旋转角度值和对象在机械手的工作空间。
图
DL2模型的构建过程。
操纵器的几何参数如下:
联合变量限制如下:
机械臂的工作空间图所示
六自由度机械臂的工作空间。
驾驶汽车是
设备在实验系统。精度(a)戴尔的笔记本电脑,(b)罗技摄像头,(c) RC伺服MG995, (d)微,(e) Arduino兆2560 (f) 12 V-5适配器,(g) XL4015 5, (h) 16×2液晶,(i)操纵杆盾牌。
网络参数DL2控制机械手如图
网络参数DL2动力学控制。
培训结果和预测结果的电机控制信号如图
训练结果和测试数据集上的预测。
电路的实际实验系统阅读和写作上的关节变量值和反馈值16×2液晶显示在图
实际的实验系统。
关节变量值来控制机械臂位置对象(一个黄色的轮)如图
共同价值观是由语音命令接收。
在实际操作中,一般工业机器人和冗余机械手尤其是经常执行完全不如计算在理想条件下,由于许多不同因素的影响称为噪音创建完美的机器人控制系统。根据(
例如,机械缺陷可能发生之前操作由于机械制造缺陷、装配错误,或在操作过程中由于机械系统振动。同时,电子缺陷可能是由于周围环境的电磁干扰,电源的不稳定或高强度电场脉冲焊接机器。克服缺陷,额外的模块相关噪声补偿,降噪、噪声抑制未来研究将研究阶段。
本研究只考虑理想的运动学问题条件或噪音的影响可以忽略。事实上,它不可能有一个一般对所有类型的噪声抗干扰问题。因此,在实际应用时,研究小组将抗干扰解决方案适合每个上下文。
在组之间的协调多个语音控制机器人在一个狭小的空间,命名或编码为每个机器人需要通过一个独立的模块与知名度或解码功能。当操作符调用机器人的名称或激活代码,相关机器人准备好接受下一个语音指令。因此,当需要添加一个新的机器人到现有的机器人网络,可以调整模块的知名度或解码没有任何改变在整个控制系统。
不同,在机器人网络音频缺陷可能来自于声音干扰。音频可以解决缺陷的影响范围不同的连接由一个中央控制分配器和声音干扰”可以提高包括远程连接机器人”(
总之,PYTHON语言被应用到越南语音识别模块的构建人工智能模型和动力学控制的6自由度冗余机械手。DL和ML技术已成功应用,准确率98%以上的培训。数据用于训练模型DL1和DL2独立建造根据越南语言从六自由度机械手运动学建模和计算数据。人工智能模型是真正的机械手模型上测试过,给可能的结果。本研究可以作为开发应用程序的基础为各种类型的机械手(串行机械手,并联机构、混合机械手和移动机械手)工业生产(焊接机器人、机器人3 d印刷和加工机器人),医疗、服务行业、家庭活动(手术机器人,柔性机器人、软机器人、仿人机器人、无人机、服务机器人在家庭和餐馆)。
生成的数据集在当前研究可从相应的作者以合理的要求。
作者宣称没有利益冲突。