文摘
针对复杂多变的特点,智能歌唱技巧在物联网的背景下,提出了一种特征提取方法适合智能歌唱技巧在这个上下文。首先,关注声音特性,时域算法基于开环和闭环基因提取提取的遗传特性与伴奏的歌曲;然后,及其特征提取部分使用窗口的移动匹配算法,并使用相似的片段除以相邻段获取部分功能与情感因素。段特征输入到BP改善情绪情感识别的识别器。最后,聪明的歌唱技能整个音乐的决心。实验结果表明,随着时间的增加特征提取,提取现有方法的结果的准确性变化小,这基本上是保持在低水平在15%和30%之间。当该方法智能歌唱技能信息的特征提取,精度显示了持续增长的趋势,随着时间的增长,其准确性明显高于现有的方法,说明该方法在特征提取的准确性有显著的优势。因为这个波形特征提取方法应用于智能物联网背景下的歌唱技能,提取效率高的优点,精度高,可靠性。
1。介绍
随着物联网的发展,基于物联网的智能歌唱艺术也在发展中。物联网是一个网络,允许您连接到互联网,交换信息,沟通,和智能地识别任何产品使用数据传感器如射频识别、红外感应器、全球定位系统、激光扫描器,控制和管理(1]。网络智能歌唱能力是人们掌握和再现音乐的基础。如何提取波形迅速成为物联网的关键技术(2]。智能唱歌技能包括两个方面:一是提取歌手的歌从现有乐器的伴奏声音,第二是研究歌手的歌唱能力从基本特征的角度来看,复杂的特点,和一般特征。它的主要属性是树脂长度和力量。复杂性分析的基本特征,如间隔,节奏,旋律,而一般特征分析了音乐的复杂特征,如情绪和风格。响度的主要特点、长度和强度是常见的音乐(3]。在此基础上,它可以包括三个方面:识别阶段的基因(注意)特性的声音,区分片段和片段的阶段特性,打开音乐的情感特征的阶段。基于这三个方面(4],本文使用不同提取方法提取的波形特性智能物联网背景下的歌唱技能获得的提取方法提取效率高、准确和可靠的提取结果,提高智能歌唱技能的发展的背景下,物联网。目前,研究提取波形特征。图1显示了多通道波形检测过程意义的睡眠阶段。
2。文献综述
自1960年代以来,各种注意检测算法已经提出,如ACF(自相关函数)方法,AMDF(平均幅度差函数)的方法,和筛选(简化的逆滤波)方法。这些传统算法有很高的误码率和穷人噪声电阻。提出了许多改进算法后,等修改后的自相关算法和基于AMDF算法循环AMDF法。这些算法与传统算法相比取得了显著进展,但仍难以实现良好的性能在强背景噪声中,高亮显示的错误判断的关系(如倍频/半频5]。Verena等人设计了一个系统独立的声乐和钢琴伴奏,但有必要预测先验信息,包括近似球场(6]。Anshakov和其他人提出单独唱歌和音乐背景预测的基音轮廓和声音的振幅调制信号。这一系列研究的进展为注意提取提供了便利,但这些系统也依赖于准确提取的笔记在相当大的程度上(7]。然而,频域算法和训练模型采用上述系统有问题,如计算复杂度高,所以很难在硬件实现其功能。在酒吧和段特征提取阶段,郑等人提出了一个基于贝叶斯动态栏指针模型理论,可以区分音乐的酒吧的位置,但它只适用于MIDI音乐与相对稳定的速度(8]。肖和其他人的序贯蒙特卡罗方法基于贝叶斯理论可以提取栏信息,但它只适用于单频音频音乐(9]。Goux等人提出了一个方法,把音乐片段通过酒吧之间的相似性,而法官酒吧的相似性计算向量包括相邻的夹角的余弦值小的结,把音乐分成多个独立的段(10]。阶段的音乐情感特征识别,谭和其他人认为,激发人们的内心情感是音乐的特点,如色调间隔,旋律强度、节奏,节奏,速度,和音色,反映通过音乐片段。这些特性是组合成一个向量来表示领域的特点,这不仅可以有效区分之间的差异部分还保留的音乐信息部分(11]。哈尼法和其他人用BP神经网络建立一个自动特征识别情绪情感识别模型但使用MIDI格式音乐文件(12]。此外,对于物联网本身,丁等人提出了一个结构化的移动应用程序识别的特征提取方法。根据移动应用程序流量的变化特征,该方法提出了一个HTTP流结构化特征提取方法来准确地识别移动网络流量所属的应用程序。交通收集工具用于收集所需的数据特征提取和交通集群。在这个过程中,可以获得公共子序列和结构特点可以通过替换字符。实验表明,该方法可以实现结构化特征识别对于大多数移动应用,涉及范围广泛,但特征识别结果的准确性不高(13]。朱等人提出了一个有效的提取方法主要特点的基于云计算的海量数据。这种方法获得的任务执行过程不同阶段通过MapReduce编程模型在云计算,提取关键特性在大数据通过编程中,评估当地的特性,选择关键特性根据评估结果,并提出了相空间重构的方法,以确保数据特征的不变性。实验验证表明,该方法的特征提取结果能满足一般需求,但是面对巨大的大数据,特征提取过程复杂,处理效率会很低(14]。鉴于上述情况,本文提出了一种基于人类语音的时域算法的框架特性和开环和闭环基因提取提取基因功能与伴奏的歌曲;然后,及其特征提取部分使用窗口的移动匹配算法,并使用相似的片段除以相邻段获取部分功能与情感因素。段特征输入到BP改善情绪情感识别的识别器。最后,聪明的歌唱技能整个音乐的决心。
3所示。研究方法
3.1。直言不讳的基因(注意)特征提取阶段
从歌曲中提取歌曲伴奏的关键是使用基本区别人类语音和音乐背景加强语音功能促进沥青萃取。我们研究人类的声音特点,重点在频域表示能量的周期性分布,并提出了一种基于筛选表示能量的判断方法来解决常见问题的判断倍频、半频错误在传统的时域算法(15]。只有一个决策方法仍不足以确保音高提取的准确性。因此,我们从3 gppamr-wb +标准的音高提取部分编码和使用开环闭环方法来确定,也就是说,首先确定音高的近似值,然后作调整和准确值,改善沥青提取的准确性和系统的噪声电阻。
3.1.1。根据筛选表示能源决策方法
筛选方法是一种经典的传统算法。其核心是利用LPC(线性预测编码)来抵消人类信道参数的调制效果。在语音信号的数字模型,表示声音的激发函数是周期性的,它的周期是1 /F0,即基音周期。演讲可以视为一个脉冲,信道调制后生成。基于LPC分析的语音信号模型,嘴唇的辐射,声道,声门的激发是由一个短时整机全极数字滤波器常数表示。 一个(z)是反滤波器。 在哪里pLPC分析的顺序。让语音信号通过一个(z)获得滤波器的输入信号H(z),即表示声音的激发函数,用于检测。
在传统的筛选算法,数据过滤的反滤波器后,自相关函数的极值计算作为最终输出。然而,由于强干扰背景噪音的音乐,周期性的信号不能反映,因此,出错率自相关函数提取音高值的很大。基于在频域表示能量的周期性分布,我们使用表示能源决策方法来提取音高值而不是直接的自相关函数。自相关频谱上的多个山峰被选中的候选人,和峰值过滤器用于每个倍频点的候选人音调表示脉冲序列的获取信号能量对应的候选人。峰过滤器是窄带带通滤波器,并根据表示脉冲带宽设置带宽的人声。选择相对应的音高值最大的能源输出节(16]。
3.1.2。开环、闭环音高提取
使用基于上述筛选表示能源决策方法,解决判断错误的八度音阶/半频关系普遍存在的传统的基音提取算法,并减少对能源决策方法的复杂性,通过开环估计基音周期大约是距分析和记录为最高(17]。在此基础上,候选人闭环球场集设置通过使用第一个和最后一个的信息帧的帧在联合国减去采样数据和值在开环间距值。值包括在21节的候选人用于进一步确保球场轨迹的平滑性和正确性,提取闭环音高和记录TCL,并定义转换球场闭环和开环间距之间的关系的框架如下: 在哪里n的多个-抽样。(来自于时域算法提取音高与伴奏的歌曲)。
3.1.3。预处理
噪音主要来自电器设备的干扰,如脉冲峰值和纹波电压。这些干扰不能过滤和消除电源电路。电源频率的干扰信号是最严重的噪音。它有不同的特征,如周期、频率和振幅的信号的音乐,它将有一个伟大的影响分析。PCM-encoded音乐信号采样密度高的特点,大量的数据,所以它才能真正恢复音乐信号,但也增加了计算提取的数据量比(18]。过滤或减少50 Hz电源频率的干扰信号,减少大量的计算的影响,积累所有采样数据的方法采用20毫秒。20 ms的原因是用作积累单元是50赫兹干扰信号的周期是20毫秒。这个公式是
图2显示了压缩信号的波形。PCM信号波形的峰值和峰值点是相同的,维持能量峰的特点。然而,仍然有很多当地的疙瘩,影响提取的准确性。
3.1.4。提取信封
信号预处理后,计算大大降低(19]。然而,过滤信号不仅包含了信息,还包含一些信息无关的节拍。从上面可以看出,击败了信息隐藏在50 Hz∼200赫兹频段的音乐信号频带高于200赫兹时被那些nonbeat信息。因此,在音乐信号,低频分量的主要组件。然而,可以使用各种近似多项式近似这个过滤器的设计。均值滤波的时域表达式 在哪里是截止频率。可以构造高斯滤波器的逼近滤波器根据多级均值滤波器的级联。的频率响应的self-multiplication意味着滤波器频率响应:
当 , 是高斯滤波器。极限表达式是
介绍了高斯低通滤波器来过滤预处理PCM信号,最后,一个平滑的信封只包含低频信号得到如图3。
本文的研究对象是音乐文件的采样频率44100赫兹和采样位16位。这种格式音乐文件是目前使用最广泛的音乐文件。通过WAV文件的分析和研究,代表音乐的采样数据信息提取。通过上面的算法研究,PCM信号能量变化的信封。在时域峰值检测的优点是直观形象,但一些峰值点小改变将省略20.,21]。在频域峰值检测,尽管它并不容易忽略的峰值点的时候点大的变化率,它还将包括一些非高峰时间的变化率大点。在这里,我们可以提取峰值点结合时域和频域。虽然操作的数量增加了,可以大大提高精度。每两个音符的时间间隔,使统计数据计算如图4。
从图可以看出,主要集中在区间上的记录间隔0.6∼0.9秒的高峰。如果点是高峰,较前注意时间间隔为0.6秒到0.9秒,然后点的起点;否则,它是一个错误。一旦确定起点的注意,注意的基本特征,如长度、频率和强度,可以来源于它。
3.2。特征提取阶段的部分和段落
音乐部分由音符的顺序提取在前面的步骤中,和音乐部分是由多个部分组成的。根据强弱定律指出,音乐分为几部分,部分提取的特征信息。然后,根据相邻部分的相似度,音乐分为几段,段提取的特征信息(22]。
3.2.1之上。分段特征提取
酒吧的音乐节目交替的法则力量,在一定的时间范围是固定的。本法可用于提取部分的位置。在音乐方面,时间分为相等的基本单位,每个单元的长度是报告的时间(23]。因此,每个音符的时间长度是相同的,和时间长度部分包含相同数量的笔记是相同的。音乐总是由交替的胜和弱胜强。这个变更不能乱和任意安排,但组织部分根据某些法律的力量和弱点,然后在此基础上循环。音乐的强度规律一直在生产过程中设置音乐的分数,也就是说,只要一段音乐的乐谱创作完成后,其强度法是固定的。在分数面前,这将是2/4、3/4,和其他方法。音乐会有多种力量的法律,但其强度法在一定的时间范围内是固定的。
图5信号采样数据压缩后的信封,图吗6的位置提取的笔记。在图10秒6注意显示了这样一个表单:“强、弱、弱、强、弱、弱,强,弱,强,弱,弱,强,弱,弱,强,弱,弱,弱。”可以看出,在此期间,它被重复的节奏规律“强、弱,和虚弱。“只有30秒和32.5秒之间,有一个“强大而虚弱。”有两种解释方法,改变节奏法律从“强、弱,和弱”“强和弱,“因为只有一个“强和弱,“这是不可能的。有一个错误,一个弱不提取。相反,看着图5,最初是一个局部最大值在30秒的位置,但它不是杰出,因为前后的差异太小了。因此,有一个错误(24]。可以看出,如果酒吧行划分,进而提取的准确性笔记可以优化。
注意的位置已经提取,基于时间点。因此,首先定位这些笔记和阅读的时间点距这些时间点。模板设置米= {米1,米2,…锰}据几位实力建立法律的音乐。设定一个时间窗口的长度米和步长米/ 2和过程根据以下算法:
在时间窗口中,与模板匹配的数据米。如果击败强度法的发生的概率大于50%,法律在第一米/ 2时间已经确定,马克和分条线。调整大小的米的多个小节线的长度根据小节线的长度和法律。
向前移动时间窗米/ 2为模板匹配步骤。如果击败强度法的发生概率大于50%,法律是一样的,在前面的步骤中,重复这个步骤;否则,跳到下一步。
如果节奏强度法的发生概率大于50%,但不同于前一步,那么它被认为是有一个分裂点正则变换的时间窗口。小节线的长度的强度法确定前一步是步长来移动窗口和匹配,直到匹配成功。后的小节线的长度相匹配。如果它是成功的,它表明这一点的划分点转换。
调整米重复步骤2。
最后的窗口,小节线提取完成。
酒吧是由注意序列,所以酒吧的特征向量可以由笔记的特点。笔记的基本特征是,强度和长度。因此,这些特征可以用来表示的特征的特征向量。公式如下: 在哪里巴勒斯坦权力机构是球场上的平均值;Ps是稳定的,拉声音强度的平均值,是声音强度的稳定性,达声音长度的平均值,稳定的Ds是长度。然后,部分的特征向量
3.2.2。段特征提取
一段是由部分组成的,相邻部分在同一通道是相似的。因此,通过判断相邻部分的相似度,相似的相邻部分可以连接到形成一个通道。相邻部分的相似度值和部分的数量在一段有一定的范围,所以三个阈值集,即特征向量相似性阈值(特征向量相似阈值),麦芽(最大长度阈值),最大长度阈值和最小长度阈值MNLT(最小长度阈值)。没有严格的标准选择的阈值,和经验值通常是选择。阈值是否正确与否将影响算法的准确性和最具影响力的是类似的阈值。一些酒吧的音乐起到过渡作用,可分为下一段。Pb用于表示小节段的数量,MB用于表示小节音乐的总数 用于表示相邻节的相似性,然后呢和 用于表示特征向量的两个相邻节吗Bi和Bi+ 1,分别。采用以下算法:(1)法官的大小我和MB。我≥MB,跳到5;否则,使用向量的夹角的余弦值来计算两个特征向量之间的距离测量,见公式(10),继续2。 (2)如果 ,继续3;否则,跳转到4。(3)如果PB <麦芽、连接和 ;我+ +;PB + +,重复1;否则,开始一个新的段落,我+ +;PB = 0,重复1。(4)如果PB < MNLT,连接和 ;我+ +;PB + +,重复1;否则,开始一个新的段落,我+ +;PB = 0,重复1。(5)退出循环,部分提取完成。
音乐之所以能刺激人们的内心感受和引起人们的共鸣,是音乐有不同的特征,如旋律,节奏,强度、节奏、速度、音色、音调区间。这些特征反映的通道。因此,我们可以使用这些功能来表达。
3.3。音乐情感特征提取阶段
使用上面的部分特征向量提取的过程中认识到情感的部分,有必要构建特征向量的映射的情感部分。因此,情感自动识别器构建了基于改进的BP神经网络识别的情感。
首先,BP神经网络的权值和阈值是1和1之间的小数,大量和不适合二进制编码。这个文档指定了实数编码的规则。算法采用平方误差标准答案在搜索过程中作为评价人的标准。选择算子确定初始方案和计算每个人群的健身价值;人口按降序排列的个体由大变小;前两人选择直接遗传给下一代,和其他人也同样分为优秀,良好,中等,和穷人。没有两个伟大的人,一个伟大的人,一个平均个体,一个可怜的人。自适应遗传算法(AGA)是交叉在人群中个体的能力和根据环境突变的概率。改进的BP神经网络算法可以用来作为分类器来识别音乐片段的情感特征。算法可以使用示例校准过程中的错误信息,避免造成overadjustment不足和连接固定结构的神经网络,并提高训练精度。 To solve these problems, this paper adopts a human-computer interaction method for the emotion annotation of learning examples, and the number of initial potential centers is determined by the number of emotion types in the training samples. To improve the training efficiency and reduce the network training time and complexity, the widths of the center of the first underground layer and the center of the underground layer are adjusted for each training sample package.
首先,BP神经网络的自动情绪识别器。自从段私下向量输入层有7个维度,在输入层神经元节点的数量设置为7。在输出层,情感表达空间设置为一个四维向量。根据凿的模型中,选择一个四维向量包含灵感,快乐,悲伤,和抒情的表达作为组件的情感特征。(0,0,0)、(0,1,0,0)、(0,0,1,0)和(0,0,0,1)代表灵感的四种情绪,快乐,悲伤,和悲伤的歌词。因此,在输出层神经元节点的数量设置为4。隐藏层:高斯函数具有简单的成像,好光滑,和良好的分析性能,所以激活函数的神经网络的隐层设置为高斯型函数如下公式所示: 在哪里是相应的宽度,是我隐层节点,和是欧几里得范数。
4所示。结果分析
4.1。特征提取结果的分析
音乐老师的指导下,这首歌样本分为五类:快,快三,三,三,缓慢和华尔兹。笔记摘要算法用于分解Ganku笔记。结果与其它测井相比算法如表所示1和数字7- - - - - -9。
表1和数字7- - - - - -9显示错误检测的平均百分比,错过了检测的平均比例,一些日志记录的平均成本算法。结果表明,平均误检测率和平均错过了这个算法的检出率高于其他算法。虽然平均时间超过其他两个算法,它是可以接受的。因此,该算法可以使记录更有效和准确。
我们收集了201件音乐的各种类型和长度,以及相关的笔记,以波的形式音乐文件。音乐分为五类:3月,快三,中间三个,慢三,华尔兹。八十块的音乐是随机选择的,每一段的笔记和行手动标记。程序旨在提取钞票,钞票获得位置,然后比较其与手写的钞票位置信息。结果如表所示2。华尔兹和减速三分之二,低频信号之间的界限是尖锐指出,和信封的山峰更容易分散,导致更高层次的注意识别。等快节奏的音乐,快3月和3月,信封是不确定的高峰期,所以注意识别是相对较低的水平,和错误检测和错误的数量是相对较高的。然而,总体验收仍然很高。
通过间距、长度和强度的笔记,特征向量的部分进行了分析,然后根据相似的相邻段划分部分获得段的7维特征向量。80件音乐提取改进的BP神经网络进行训练。培训结束后,剩余的121首歌样本标记与情感。部分提取、部分提取和段进行特征提取,分别。7维线段特征向量作为输入,输入到改进的BP神经网络情感识别模型,输出段的情感类型,数的比例的四个音乐类型,最后得到的主要情感音乐。结果如图所示10和表3。
从图可以看出10和表3有一个小,但可接受的误差在正确地识别大多数音乐情感和音乐情感识别。因此,该方法可以从不同类型的波形提取音乐特点的音乐文件。
4.2。波形特征提取性能分析
把应用价值的智能歌唱技能信息的自动特征提取方法付诸实践,圆AMDF法特征提取法(方法1)基于AMDF算法提取方法是一种有效的关键。云computing-based大数据功能(方法2)和贝叶斯理论基础动态栏指针设计而提出的解包方法(方法3)。以提取精度为指标,比较不同方法的提取效果,结果如图所示11。
据图分析11特征提取时间的增加,现有方法的提取结果的准确性变化小,这基本上是在低水平保持在15%和30%之间。当该方法智能歌唱技能信息的特征提取,精度显示了持续增长的趋势,随着时间的增长,其准确性明显高于现有的方法,说明该方法在特征提取的准确性有显著的优势。这种方法使用multifeature歧视方法提取特征和实现准确的提取有价值的功能区分价值的特性和价值功能的智能歌唱技能的信息。它可以应用于物联网领域的信息处理提供技术支持相关的信息处理。
5。结论
基于波歌唱技能的特点,在互联网上,本文成功地识别的特点,指出,措施,部分,和曲调分三个阶段:拆除的色调特点、解剖段与段的特点,和解剖的情感特征。提取音乐特性的实验表明,该方法可以有效地生成不同类型的音乐功能,和特征识别的精度可以满足要求的解开歌唱技巧在互联网背景下的波形特性。与其他算法相比,它具有更高的准确性、可靠性和较高的提取速度。音乐是复杂多样的。不同的音乐有不同的音乐理论和信号。甚至一段音乐可以在不同的环境有不同的情感表达。准确、快速提取特征的音乐,不仅计算机相关技术的改善和发展,还支持音乐理论,心理学,和其他领域是必要的。这项研究仍处于初级阶段,仍然是一个庞大的研究领域等研究人员的努力。希望本文可以为其他研究者的研究提供参考。
数据可用性
没有数据被用来支持本研究。
的利益冲突
作者宣称没有利益冲突有关的出版这篇文章。