多媒体的发展

在这一页上

文摘介绍结论数据可用性的利益冲突引用版权相关文章

特殊的问题

多媒体质量建模

把这个特殊的问题

评论文章|开放获取

体积2021年| 文章的ID2981531| https://doi.org/10.1155/2021/2981531

多媒体识别基于隐马尔科夫模型的钢琴音乐

应朱 ¹

学术编辑器: 米歇尔Kadoch

收到了 2021年8月30日

接受 2021年10月25日

发表 2021年12月30日

文摘

钢琴表演是一种艺术与丰富的艺术元素和不可预知的性能技巧。这是一个重要的载体扮演美丽的钢琴的声音。音乐钢琴表演的张力和表达的一代是钢琴表演的生动的显示能力。在钢琴表演中,我们应该注意培养和灵活的应用程序性能的技巧。为了保证钢琴表演的丰富性和艺术,它是完全基于钢琴表演的艺术特征。通过深入分析隐马尔科夫模型的原理,将其应用于多媒体钢琴演奏音乐的识别过程。的过程中获得的模板,钢琴演奏音乐的基本频率大大不同,和钢琴音乐在表现过程中出现。对识别率低的问题,提出了一种多媒体对钢琴音乐识别方法。最后,实验结果表明,该方法的分析提出了16%的识别率高于传统方法,它有一个多媒体中的某些价值识别的钢琴音乐。

1。介绍

随着科学技术的不断发展,电子产品、钢琴音乐识别技术也在进一步发展。钢琴的性能识别技术从室内市场研究过程应用阶段,已经发展到一个相对较高的水平(1- - - - - -3]。目前,国内外研究的重点是对连续性能的非特异性的球员。多媒体识别具有较高的效率和精度,如音乐的内容识别、环境性能,钢琴所使用的球员,速度和性能。有一些区别现有的钢琴音乐性能识别技术和实际需要。

由于大型钢琴音乐的特点和人类之间的差异钢琴音乐和前面的钢琴音乐识别技术不能满足钢琴表演音乐的需要,研究钢琴表演识别技术已成为国内外学者研究的焦点。提出了一种多媒体识别系统对钢琴音乐基于隐马尔科夫模型的性能。通过持续改进钢琴表演音乐的识别能力,它可以广泛用于钢琴表演音乐领域的认可。

2。隐马尔可夫模型

隐马尔科夫模型通常是由多个不同的州。由于不断变化的时候,隐马尔科夫模型可以保持某种状态,也可以在不同状态之间进行切换。每一个观测向量可以得到不同的输出频率不同的州。在这篇文章中,一个隐藏的马尔科夫模型与四个州S1∼S4是用来计算处理。输入观测序列为代表 ,每个状态之间的转移概率和美国之间由a0,其中每个观测序列作为每个观测序列。在这个模型中,观察序列用作可观察到的输入序列,但每次不能直接观察到的状态。

场上部分采用基音周期的判断方法。当距下一帧之间的差异和音高的平均值小于阈值,所有先前存储帧确定这些框架是一个类别的帧,这个过程将持续到球场的区别下一帧周期大于阈值。处理所有这些帧一帧,融化的光谱参数Mel-ceptral 13 MCP (MCEP)计算得到。实验中定义的阈值是1。原理图如图1。

为了保持数据的平衡在随后的谱平均(CMS)和相关谱(意大利面)算法,我们复制计算MCPP数据在相应的10 ms框架和执行光谱区过滤。一阶和二阶的差异表现在过滤参数获取39-order参数。最后,参数Gaussized提高识别率。

马尔可夫模型使用Baum-Welch算法解决马尔可夫参数估计问题,解决隐马尔科夫训练问题。通常,当使用给定的观测序列 ,该方法使用决定λ= (一个,B,π)参数的值来确保P(O|λ)可以达到最大值。

根据相关向前向后概率和概率的定义,我们知道

当使用P(O |λ)达到最大值,因为每个实验的训练序列是有限的,不能意识到最好的方法估计参数。在这种情况下,使用Bam-Welch算法P(O |λ)一个递归的想法;是非常大的,最后,模型参数λ= (一个,B,π)。

升值Baum-Welch算法公式的递归

其中, 表示给定的训练序列O和模型参数λ马尔可夫链在时间t是在州和的概率状态时t+ 1,代表数量的期望值的过渡状态国家。

辅助函数的定义

其中,λ最初的模型参数吗λ= (一个,B,π),代表了模型参数有待解决,O代表的顺序观察训练和使用 ,和年代作为一个特定的状态序列。

马尔可夫模型不仅可以找到一个足够好的状态转换路径也迅速计算出相对应的输出概率路径。同时,所需的计算使用马尔可夫模型的方法来计算输出的概率远小于总概率的公式。

定义作为沿着一条路径t和 ;的最大概率正在生成,即

隐马尔可夫模型的递归形式如下。(1)初始化: (2)递归: (3)结束: (4)找到状态序列:

其中,代表累积的输出值的概率我th状态时t,代表了连续的状态参数我th状态时t,国家在时间吗t在最优状态序列是最终的输出概率。

3所示。多媒体识别钢琴音乐的过程

钢琴表演音乐识别已成功应用于智能手机和电视机等设备,将在人类未来的生活方式产生深远影响。多媒体的钢琴表演将所有钢琴表演的数据转换成文本形式,突破语言和语调的差异,导致在机器与人之间的沟通障碍,并使用钢琴表演的交互系统作为人机对话的一个重要工具。钢琴表演音乐识别系统的建设进行了一定的硬件条件和实验平台。钢琴表演音乐多媒体识别本质上是一个模式识别的过程。它主要包括钢琴音乐信号的预处理,及其基本原理如图2。

从图可以看出2,除了核心识别程序,钢琴音乐多媒体性能识别系统还包括钢琴表演音乐输入、参数分析和语法语言模型建设。钢琴表演音乐识别系统主要由三部分组成:钢琴表演音乐信号预处理,核心计算,识别基本数据(4]。

4所示。系统硬件结构设计

钢琴表演音乐的多媒体识别基于隐马尔科夫模型的正确转换获得钢琴表演音乐信号,如图3到一个文本形式。

从图可以看出3钢琴是一个时变信号和稳定。因此,当钢琴音乐信号处理,需要使用一个函数来区分与钢琴音乐信号。每一段叫做一帧,和相邻帧之间有一定数量。重叠可以减少跳跃变化。钢琴音乐信号的鲁棒性特征从每一帧中提取,可用于去噪和特征提取5,6]。

4.1。钢琴音乐信号处理模块

当钢琴音乐信号,它将改变随着时间的推移,但是一旦生成混叠噪声,钢琴表演信号处理将是无效的。因此,在多媒体识别之前,必须使用低通滤波器混叠预防处理。图4显示了低通滤波器设计的钢琴音乐信号处理模块。

从图可以看出4高保真OPA 604低通滤波器用于JFET输入,具有高载波阻抗和低失真的特点。钢琴音乐的信号处理过程不受混叠噪声的影响,并得到正确的和有效的信号处理结果。它可以保证提供准确数据的多媒体识别音乐(钢琴表演7,8]。

4.2。多媒体对钢琴演奏音乐识别模块

音乐多媒体识别模块,它使用信号处理的结果通过弹钢琴来执行大量的计算,可以使用一个DSP芯片处理数字信号,并已被紧凑,适合安装的功能。DSP芯片具有很强的网络交互功能。选择OMP美联社5912年zzg模型DSP芯片形成各种各样的开发工具和多媒体数据库。你可以免费使用该系统。多媒体的设计识别模块如图钢琴表演5。

从图可以看出5OMUAP 5912 zzg类型芯片存储处理器规格是300 KB的随机存取存储器,和钢琴在液晶性能数据将缓冲。使用记忆卡来扩大系统内存,使用矢量图缓冲区音频和移植相关的钢琴表演音乐识别序列通过以太网接口(9,10]。

设计系统的硬件结构,按照的原则对钢琴音乐识别性能。如果你使用这个函数来处理信号段,钢琴表演的跳跃变化将更小。钢琴演奏音乐的过程噪声信号影响别名,和一个低通滤波器,以防止混叠是为了确保信号处理结果的准确性和有效性。信号处理的结果是使用多媒体的钢琴音乐识别模块来执行大量的计算。如果OMP美联社的DSP芯片5912 zg选择模型,系统设计成本大大降低。识别序列相关的钢琴音乐是通过以太网接口完成移植的系统硬件结构设计(11,12]。

4.3。系统软件功能设计

根据above-designed钢琴表演音乐多媒体识别模块,我们设计它的软件功能13,14]。具体设计流程如图6。

识别的钢琴音乐,声音具有非线性特征,符合人类听觉神经信号的发射和接受,和识别效率高。钢琴音乐的特点是用来处理过滤样品,和钢琴音乐是根据帧分离。为了盲目细胞匹配过程,隐马尔可夫模型可用于平滑相邻帧之间的信号传输的钢琴音乐15]。

多媒体识别系统基于隐马尔科夫模型的自动播放音乐在钢琴上选择窗函数形式音乐的特点,用户在钢琴上。词性解码和马尔可夫模型下进行语法分析得到信号频率的钢琴音乐,我们使用隐马尔科夫模型变换帧序列,分析和删除一些无效的数据帧序列。

通过以上步骤,钢琴表演音乐的处理结果框架可以获得,但处理结果受到突然的噪音的影响。一些钢琴表演音乐帧的短时平均能量急剧增加,和识别结果是不正确的。设计如图7。

具体实现步骤如下:(1)当玩钢琴的音乐信号,当它是在沉默的阶段,状态= 0增加钢琴演奏音乐的信号帧信号。如果一个特定的框架是短暂的,能量太高,这个框架的起点是钢琴歌曲的信号。在这个时候,状态= 1;钢琴表演的信号已经进入了一个过渡时期。(2)继续添加钢琴表演信号帧。当某一帧能量过低在很短的时间内,框架表明过渡级别返回到沉默的阶段,和状态= 0。(3)如果这个框架的短期能量高于amp1帧数量继续增加,信号可以确定进入钢琴演奏音乐舞台;在这个时候,状态= 2;当前的钢琴演奏音乐帧的帧数是初始点钢琴演奏音乐。(4)当当前帧用来播放音乐在钢琴上,状态= 2,如果短期内的能量在钢琴上演奏音乐的框架是低于amp2,这段是噪音。(5)继续增加帧数。当持续时间长于沉默的阶段,这意味着钢琴音乐信号的终点是正常的,可以输出和有效的钢琴演奏音乐。

根据系统软件设计过程,隐马尔可夫模型可用于过程的窗口操作单元匹配,使钢琴的相邻帧之间的信号传输性能更平稳。自动选择窗函数形式,隐马尔可夫模型的帧序列转换。结果是,由于存在无效数据的一部分,有必要删除数据和设计过程的一部分处理阶段完成系统软件部分的设计。

5。实验

为了实验分析钢琴表演音乐多媒体的有效性识别系统基于隐马尔可夫模型,有必要提取钢琴表演音乐训练小组的一部分从标准模式识别数据库。

5.1。实验参数设置

实验参数设置如表所示1。

5.2。实验环境设置

为了防止钢琴表演音乐多媒体识别系统安装在计算机上的硬件性能的影响,无法发挥所有的性能,有必要使用高端的性能系统在计算机上进行实验验证和分析。

5.3。多媒体识别钢琴音乐的过程

第一个是获得良好的样品和用微机进行仿真实验。中国四个短语的音乐、广播、GPS导航,空调作为实验对象。两个样品每个短语的记录通过多个four-phrase录音来生成示例数据。

其次,初始模型通过Bam-Welch训练算法。培训是隐马尔科夫的最复杂的问题,这是最重要的问题。收集的n通道声音信号短语并保存每一帧信号的特征参数。这些参数代表短期演讲片段的特征。分析收集到的MFCC参数向量的所有样本的声音通过聚类方法形成一个码书矢量集。使用观察符号代替。培训的部分主要是基于这样的观察序列来确定这两个参数矩阵A和B .培训的具体步骤是首先确定A和B的初始值和使用向前和向后向前和向后算法来计算概率和输出概率。λ最后,证实了收敛性。结果可以重复很多次。通常,我们的结束时间设置20个重复。

第三,我们输入的声音样本中存在的模板,进行端点检测,检测到声音信号的起始点和结束点。端点检测的帧长度是选为240点。当帧移动到80点,必须使用for循环来检测每个单词的端点。

第四,我们调用特征参数提取函数,提取特征参数,逐帧处理声音信号,并提取帧参数的声音信号。

第五,我们所说的维特比函数,输入和识别语音和模板的声音,和发现的最大概率输出模板识别的结果。在图8的训练和识别过程,基于隐马尔可夫模型的语音识别系统。

5.4。实验结果和分析

根据上面的实验参数和实验环境,传统的系统的识别效果和马尔可夫模型进行比较和分析的影响下突然的噪音。

钢琴音乐信号和短期能源这两个系统的验证,结果如图所示9。

(一)

(b)

从图可以看出9之前的信号系统是1000∼2000赫兹和6300∼6900赫兹,和中断发生在8900∼9200 Hz,不能在短时间内的能量。相反,基于隐马尔可夫模型,没有中断的现象,可以准确地获得和短期能源。

基于以上对比,比较了两个系统的识别效果的影响下突然的噪音,和结果如表所示2。

从比较结果表2可以看出,基于隐马尔科夫模型的识别效果优于传统的系统。

根据上面的内容,当噪声是20 dB,可以得到以下实验结果。40 dB, 60 dB, 80分贝和100分贝,基于隐马尔可夫模型,识别效果是15%高于传统的系统:20%,26%,22%,48%。因此,基于隐马尔科夫模型,可以看出,多媒体的设计识别系统对钢琴演奏音乐是有效的。

6。结论

因为现有的钢琴表演音乐识别系统相对比较复杂,受时间限制条件下,传统的识别方法很容易受到突如其来的噪音,和钢琴音乐识别性能相对较差。基于隐马尔可夫模型,本文提出了一个多媒体钢琴表演的识别方法。这种方法旨在突如其来的噪音,加上一个低通滤波器。然而,由于环境因素,钢琴音乐的识别性能增强,提高信噪比,提高钢琴音乐识别的准确性。

数据可用性

使用的数据来支持本研究的发现可以要求作者。

的利益冲突

作者宣称没有利益冲突。

引用

j . m . Orjuela-Rojas和p . monta识别音乐的情绪行为变异的额颞叶痴呆,”航空杂志上动作片de Psiquiatria,卷64,不。11日,第623 - 620页,2021年。
视图: 出版商的网站 | 谷歌学术搜索
x王”,研究基于计算机平台钢琴教学模式,“航空杂志上de la Facultad de Ingenieria,32卷,不。12日,第1099 - 1095页,2017年。
视图: 谷歌学术搜索
没有,”演奏钢琴droid(全局),“IEEE频谱,54卷,不。8、16 - 17,2017页。
视图: 谷歌学术搜索
e . Togootogtokh t . k . Shih w·g·c·w·库马拉S.-J。吴,S.-W。太阳,h。常,“3 d手指跟踪和识别图像处理与深度传感器,实时播放音乐”多媒体工具和应用程序,卷77,不。8,9233 - 9248年,2018页。
视图: 出版商的网站 | 谷歌学术搜索
c·特劳伯“钢琴音调控制通过变异的“重量”应用于钥匙”美国声学学会杂志》上,卷141,不。5,3874年,页2017。
视图: 出版商的网站 | 谷歌学术搜索
k . Mcneely-Whtie和a . m .佳”音乐识别没有识别及其与记忆说定的关系:一项研究使用“钢琴玩家”、“新思想在心理学卷,55 50-57,2019页。
视图: 谷歌学术搜索
l·陈,“现代钢琴演奏模式的优化分析基于ultimedia系统,”Boletin Tecnico /技术通报,55卷,不。11日,第525 - 519页,2017年。
视图: 谷歌学术搜索
d .达米安·d·约翰逊,g . Tzanetakis”检测手的姿势在钢琴演奏中使用深度数据,”电脑音乐杂志,43卷,不。1,59 - 78年,2020页。
视图: 出版商的网站 | 谷歌学术搜索
a . Cosimato r . d . Prisco, a . Guarino有位名为d·玛兰蒂诺,和r . Zaccagnino”成功的难题音乐:打它或谈论它吗?”IEEE访问7卷,1 - 5,2019页。
视图: 出版商的网站 | 谷歌学术搜索
a . Adamyan和安娜,”音乐教育成人初学者在亚美尼亚问题:具体分析钢琴演奏的困难,”英国音乐教育杂志》上,33卷,不。8,66 - 79年,2018页。
视图: 出版商的网站 | 谷歌学术搜索
C.-J。洲和y香港低唤醒钢琴音乐评级的分析发现是什么让安宁和悲伤的音乐很难区分在音乐情感识别,”《音频工程学会音频声学应用程序,33卷,不。2、133 - 145年,2017页。
视图: 谷歌学术搜索
f·福特和大肠Altenmuller一方面或另:权衡在计时精度用双手的音阶演奏,”认知心理学的发展,15卷,不。1,第210 - 197页,2019。
视图: 出版商的网站 | 谷歌学术搜索
n .朝圣m·费罗和m·阿瓦德”自动作曲家识别multi-voice钢琴作品使用有节奏的特性,n克和修改皮质算法”,复杂和智能系统,4卷,不。1,55 - 65、2018页。
视图: 出版商的网站 | 谷歌学术搜索
h·d·ec和s Saritaş”音乐的影响病人的生命迹象的鼓舞单位/腹腔镜胆囊切除术后恢复室,“整体护理实践,33卷,不。5,295 - 302年,2019页。
视图: 出版商的网站 | 谷歌学术搜索
a . Campayo-Muoz d Cabedo-Mas和哈格里夫斯,“内心的技巧和音乐表演在小学钢琴学生在西班牙音乐学院:三个案例研究,“国际音乐教育杂志》上,38卷,不。1,第112 - 93页,2019。
视图: 谷歌学术搜索

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

370年

下载

458年

引用