文摘
为了解决这一问题的影响功能词的位置在歌词的音乐情感分类,本文设计一个音乐分类和检测模型在复杂噪声环境。首先,电子音乐信号的智能检测算法在复杂的噪声提出了场景,可以解决当前电子音乐信号检测过程中存在的局限性。同时,去噪技术介绍,消除噪声和提取信号的特征。其次,从音频和歌词歌曲情绪的角度分析和歌词文本的独特特点,抒情情绪分析方法提出了基于文本标题和位置重量。最后,考虑功能词的重量的影响在不同位置的分类歌词,层次分析法是用来计算的重量特性在不同位置的文本标题和歌词之前,和之后的文本。结果表明,在复杂的噪声环境中,音乐的分类和检测的准确性提出了模型是90%以上,远远超出控制范围的音乐处理的实际应用。音乐分类和检测的效果优于对比模型,具有一定的实际应用价值。
1。介绍
音乐是一种文化的表达。根据不同的乐器,节奏,和安排,人们可以感到快乐,愤怒,悲伤和快乐的音乐。愤怒、悲伤和快乐已经成为现在人们享受音乐的主要形式1- - - - - -3]。随着智能手机的普及,移动在线音乐用户的规模进一步扩大。为了提高用户忠诚度,大多数音乐软件先后介绍了音乐推荐、分类等功能,以提高用户体验。如何有效地搜索特定的音乐情感分类已成为热门的研究方向之一(4- - - - - -6]。
由于大规模投资的学者和所有职业的关注,目前有许多音乐检测算法(7- - - - - -12]。音乐与其他类型的算法相比,基于人工神经网络的检测算法和支持向量机是最常用的。此外,他们都是人工智能领域的新技术(13- - - - - -15]。在音乐的实际应用检测,人工神经网络和支持向量机有一些难以克服的问题。例如,人工神经网络的检测错误率高,音乐检测结果极其不稳定,人们常常不能得到音乐的检测结果,他们真正需要的东西。音乐的支持向量机的检测速度慢。大型音乐信号,通常是不可能获得音乐的有效时间内检测结果。与此同时,他们不考虑噪音的干扰音乐检测结果,和噪声的鲁棒性差,影响音乐的分类和后续处理(16- - - - - -18]。
为了提高音乐分类和检测的影响,提出了一种音乐分类和检测算法在复杂的噪声场景和测试它的优越性和多功能性。本文的贡献如下:(1)电子音乐信号的智能检测算法在复杂的噪声提出了场景,可以解决当前存在的一些局限性电子音乐信号检测过程。(2)去噪技术介绍了消除噪声和提取信号的特征。(3)歌曲情绪的研究分析的基础上从音频的角度和歌词,歌词文本的独特特点,抒情情绪分析方法的基础上,结合文本标题和位置提出了重量。(4)考虑功能词的重量的影响在不同位置的分类歌词,层次分析法(AHP)是用来计算的重量特性在不同位置的文本标题和歌词之前,和之后的文本。
2。相关的工作
音乐分类是将现有的音乐分为不同类别按照一定的标准。分类标准通常是决定根据人类的主观感知。音乐心理学的知识,音乐信号处理、模式识别等学科参与整个系统框架的音乐分类。目前,许多研究人员已经提出了很多有效的算法来实现音乐的分类。互联网的新时代在不断升值。人们也追求新的发展而专注于智慧。各种形式的音乐已经渗透进人们的生活,已经悄然成为人们饭后的精神粮食。与此同时,互联网已经成为了音乐的传播的主要载体。
以音频的角度为出发点,研究人员进行情感提取相关的声学研究音乐情感特征从音乐节奏和旋律的音频数据和分析音乐的速度和强度。陈等人。19)提出了一个细胞混合音乐情感分类的信息。这种方法是基于三元语义结构的高维模型概念和估计在每段音乐的情感。石漠et al。20.)提出了一个基于音乐的音乐分类方法突出检测。本文使用高斯混合模型和学习演算法结合提出的节奏特点和音色特点和提高音乐情感分类的性能的基础上,发现音乐突出部分。音乐分为三类:平静、愉快和兴奋。实验结果证实,该方法实现了初步和有前景的结果的准确性。最后这种方法的准确性高达97.6%。柯et al。21)构建了一个基于支持向量机的中国音乐分类模型提取音乐声学特性。发现特定时域的特征组合因素和频域三个因素是最好的音乐情感分类使用支持向量机分类器在中国,83.85%的准确率。可以看出,时间特性仍在以听力非常重要的音乐情感分类。朱et al。22]花了多声道的角度作为起点来提取五个方面的声学特性。BP神经网络模型用于100多训练,最后音乐情感分为8类。给定的误差范围内的准确率超过90%,并取得了较好的效果。苏et al。23)提出了一个音乐识别系统基于两级支持向量机。301年音乐作品,10倍交叉验证是用来评估的分类性能。与传统的分类方法不同,这种分类方法分配一个情感类别中的每个30年代音乐剪辑的二分法。情感分类的流行、摇滚、爵士、蓝调分为四个类别的幸福,悲伤,冷静,和愤怒也取得了良好的结果。
从歌词的角度,Ahuja et al。24)专注于如何从歌词文本中提取有用和有意义的语言特性协助音乐的情感分类。语法语言模型的框架下,研究了三种预处理方法和一系列的语言模型与不同的订单中提取更多的语义功能。然后,三个不同的学习观念是用来测试的分类性能。实验结果表明,特征提取方法改进音乐情感分类的准确性。在阳光lyrics-based情绪分析方法提出的et al。25),模型集成到情绪向量空间模型来考虑情绪单元特性的定义,和更有识别力的支持向量模型用于歌曲情感分类研究。歌等。26)使用中文分词、特征提取、文本向量化,在流行音乐和权重进行情感分类基于歌词的角度。然而,算法被用来进行情感分类的准确率超过90%。为了验证不同的数据集对分类性能的影响,四个不同的数据集被放入了朴素贝叶斯模型训练和比较结果(27]。最后,情绪分类后准确率约为68%,而验证不同数据集的影响是不同的。
从音频和歌词融合的角度来看,王et al。28)进行了全面研究歌词的音乐情感分类的作用通过评估和比较各种文本歌词的特点,包括语言和文本样式特性。然后,两种融合方法用于把最好的歌词特征的特征提取音乐音频。王等人。29日)提出了一个multilabel再邻居算法。他们与TF-IDF算法结合的方法解决情感词的模糊性对音乐情感分类研究。熊猫et al。30.)提出了一种方法来检测基于抒情歌曲的情感和音频功能。首先,歌词是分裂生成抒情功能,然后计算价值和激励价值。此外,语言关联规则应用于妥善处理歧义。
当执行情感分析的音乐,不同的数据形式需要数字化进行进一步处理(31日,32]。一些学者将音频信号分解等音乐节奏和音色,提取声学特性,并结合相关算法对情感进行分类。Noroozi et al。33)声学信息导入到支持向量机建立一个中国音乐分类模型。Chaudhary et al。34]提取信息从不同的音轨的BP神经网络模型的样本数据对音乐情感分类。黄等。35]使用支持向量机分析音乐情感通过总结单词与特定的含义。
近年来,机器学习发展迅速的形成因素的分析复杂问题[36,37]。一些学者也用机器学习来分析音乐情感和音频信号之间的对应关系。随着研究的深入,研究方法逐渐演变从原来的书分析单模多维数据的联合分析,和multimodel特性数据分析也取得了良好的应用程序在音乐情感分析。
3所示。音乐分类和检测算法
3.1。音乐信号的噪声抑制和音乐信号的特征提取
当音乐包含噪音,音乐信号曲线将会改变。假设噪声n(t)和有用的和干净的音乐信号nr(t),然后音乐信号复杂噪声环境中的以下方程:
在公式(1),α代表噪声的类型,如白噪声和高斯噪声。
噪音n(t)通常会增加存储空间的音乐信号,和变化曲线发生变异,使它无法正确识别音乐信号的类型。因为需要消除噪音的负面影响,本文选择小波变换去除噪声的音乐信号。假设一个音乐信号含有噪声之前和之后的变化曲线如图1。可以清楚地看到,无噪声的音乐信号的变化特点,音乐信号与噪声是非常不同的。
(一)
(b)
为了抑制噪声在音乐信号在最大的程度上,小波分析算法用于删除音乐信号中的噪声。连续小波应满足下列条件:
在公式(2),变量问位移。
电脑处理音乐信号,所以它是一个离散信号。集一个= 2 /j和问= 2−j/k和离散小波方法如下:
抑制电子音乐信号的步骤如下:步骤1。使用小波分析分解原始音乐信号获得多个音乐subsignals。每个音乐subsignal包含一个小波系数,根据频率音乐subsignals排列。小波系数向量的第一个音乐subsignal表示为n1,然后小波系数向量组所有subsignalsN= (n1,n2,…]。步骤2。音乐信号向量集可以分为两个部分:有用的音乐信号(一个_米)和噪声(n_米),即: 步骤3。计算标准偏差的音乐信号噪声( )。然后,设定一个阈值(刺),两者之间的关系可以描述如下: 设置的小波系数值subsignal矢量大于刺,和其他人保持不变。的新向量音乐信号的小波系数如下: 步骤4。利用小波分析的小波系数重构音乐信号获得音乐信号没有噪音。
3.2。提取位置因素特征字的歌词
歌词情感分析的总体结构如图2。为了融合歌词和音频数据,有必要提取特征向量的两种形式的数据,分别。歌词文本的特征向量的提取采用向量空间模型。这个想法是为了治疗不同音乐的歌词作为一个n维空间向量和形成一个功能word-lyric矩阵排序功能词的歌词文本。
为了描述特性的影响与不同频率的音乐情感的表达能力,有必要评估功能词的频率和位置。术语frequency-inverse文档通常是用来判断一个特定的词的重要性在训练数据集的文本。TF-IDF主要涉及两个方面的计算。TF代表一定的频率特征词汇的比率在文本出现的次数所有单词在文本特征。IDF用于描述程度的分类特征的词,和它的计算公式如下:
在公式(7),num (t)代表文本包含的数量特征的词xN代表文本的总数。在许多情况下TF-IDF起到了良好的效果。然而,该算法并不敏感特性的位置的话,不能评估带来的影响类别特征字的位置。可以看出特征的词出现的位置有很大的影响在整个歌词所显示的情感。因此,本文将歌词文本分为4部分:诗,合唱,升华,和结局,并计算相应的位置因素的权重,然后执行更准确的情感分类结果。摘要TF-IDF改进,以下表达式是用来计算:
在公式(8),TF-IDF的定义是一致的,这意味着一定的频率特征字在当前样本。的变量h代表的位置因素诗、合唱、升华,也没有终点。在计算词频TF,考虑到歌词本身的单词数量很小,功能词的数量可能是1,这使得lg函数值0,从而影响实验的准确性。变量d和变量k是词频的调整因素和位置因素,分别主要减少的影响区别不同的音乐歌词的音乐情绪的结构分析。
位置的因素h层次分析法(AHP)用于纸来计算。主要过程如下:构建一个层次结构模型,构造成对比较矩阵,和检查的一致性。本文中的歌词分为4部分,和权重比较通过构造判断矩阵。当有n因素年代= {年代1,年代2……sn},判断矩阵米可以表示如下:
的元素米ij判断矩阵的代表的比例如果音乐情绪的影响因素。因此,判断矩阵的主对角线上的元素都是1。此外,
因为歌词的文本分为四个部分:主歌,合唱,升华和结束的价值n是四个。用1 - 9的规模来形容的重量因素对音乐情感的判断的影响。奇数越大,就越重要。偶数代表相邻判断的中间值。因此,判断矩阵的位置因素特性本文句歌词如下:
位置因素的价值可以通过计算判断矩阵的最大特征根及其对应的归一化特征向量。具体过程如下:(1)正常判断矩阵的每一列新矩阵(2)找到的和矩阵的每一行,分别(3)计算总额的比例,即四个职位的重量的主要歌曲,合唱,升华,结束在歌词的音乐情感分类。
3.3。聪明的音乐情感分类算法
音乐情感模型意味着我们需要找到一个合适的分类模型来识别音乐的情感类别。这个过程主要包括两个阶段:训练阶段和测试阶段。
所谓的培训阶段的主要任务是学习与已知的音乐训练集文本情感标签,找到模型及其参数,直到模型建立。
在测试阶段需要做什么来验证学习模型。具体方法是单独的测试集的音乐文本从相应的情感标签,音乐样本分离未知的情感标签输入学习分类预测模型,并比较预测情感标签与原来的情感标签。计算的准确性预测评估模型的分类性能。
有无穷无尽的音乐情绪分析研究方法。最常见的一个是使用机器学习算法结合统计学知识进行研究。本文选择支持向量机作为我们的音乐分类模型。
支持向量机结构风险最小化理论基于统计原则具有以下三个优点:(1)结构风险最小化理论支持的,它仍然有限的小样本下具有良好的泛化能力。(2)作为一个分类学习机器,它通常将实际问题转化为凸二次线性规划问题,从而获得更多的准确性。(3)引入核函数和线性松弛将非线性问题转化为高维空间转化为一个线性可分的问题。相关计算公式只是样品的数量和与样品尺寸无关,避免样品尺寸的增加。
支持向量机打算找到一条直线l1分离这两种类型的数据。假设数据集D= {(一个1,b1),…,(,bm)}米样本,相应的标签标签=我−1 (我= 1,…,米),定义分类超平面表达如下:
其中,λ= (λ1、……λ米)是超平面的法向量b超平面的拦截。让直线L1 ,和移动直线两边。如果有两种类型的样本,可分为两种类型的样本必须满足 归一化之后。在这个时候,两个分类的样本直线l2,l3被称为支持向量。直线之间的距离d= 1 / | |λ| |。
总之,根据结构风险最小化理论,直线l1把两种类型的样本,满足学习模型的经验风险最小化。的直线l2,l3最大化两种类型的样本之间的间隔和满足最低风险的信心。最后一个问题转化为最小的解决问题λ:
在现实场景中,仍有大部分线性不可分的问题。首先,原始的低维空间映射到一个更高的纬度空间通过一个合适的映射内核函数内核(a)这是线性可分的高纬度地区,如图3。
修改公式(13此时)如下: 并通过松弛系数和内核函数,柔边核函数支持向量机有效地解决非线性问题,极大地提高了泛化能力。
4所示。结果与讨论
4.1。实验数据来源和预处理
由于本文的研究对象是multiemotion分类的歌曲,为了确保数据的可信度,歌词的文本在四类四个音乐应用程序捕获。其中,把歌词文本后在中文和英文混合或主要在英语,500件每个类别,分别计算和2000年歌词文本作为最终的实验数据集。
中文分词在结结巴巴地说分词采用精确的模式。段最准确的歌词文本的一部分,和删除停止的话,消除模棱两可的词。在特征提取方面,使用气计算功能词和类别卡方值,排序,并构造一个fixed-dimensional情感词典每个歌词文本转换成unified-dimensional词向量。
4.2。智能检测的音乐信号的性能测试
为了分析智能音乐信号检测的有效性在复杂的噪声场景设计,进行模拟测试。测试平台如表所示1。
为了测试的优越性音乐信号智能检测算法在复杂噪声场景设计,音乐信号智能检测算法在文献[11]和文献[12)选择进行比较实验,测试平台都是一样的。使用流行音乐作为对象,测试数据收集音乐信号的两种类型:一是不包含噪声的音乐信号;另一个是音乐信号含有噪声。每个方法执行5仿真实验,电子音乐信号的测试数据如表所示2。
三种音乐信号智能检测算法用于检测无噪声的和吵闹的音乐信号,分别和他们的精度结果如图4和5。比较和分析无噪声的检测精度和嘈杂的音乐信号数据4和5,我们可以看到以下几点:(1)对于无噪声的和吵闹的音乐信号,检测准确性的音乐信号的平均值在文学(11分别是86.83%和81.0%。无噪声的音乐信号的检测精度略高于音乐信号含有噪声。这主要是因为它不介绍降噪技术,不能抑制噪声对检测结果的干扰信号的音乐。因此,音乐信号检测的准确性需要进一步改善。(2)对于无噪声的和吵闹的音乐信号,检测准确性的音乐信号的平均值在文学(12分别是91.39%和86.09%。音乐信号的检测精度很难满足实际需求的音乐信号的处理,导致出错率相对较高的音乐信号检测。(3)无论无噪声的或嘈杂的音乐信号,本文算法的平均检测精度高于算法在文献[11,12]。这是因为算法介绍了噪声消除算法,消除了噪音的音乐信号,获得一个高质量的信号。同时,音乐信号过程中参数优化的问题已经解决了,音乐信号的检测误差降低,和理想的音乐信号检测结果,可以满足实际需求的音乐信号处理。
对现代大众音乐信号,探测效率是非常重要的。因此,每个实验的信号检测时间计算,结果如图6和7。从数据6和7,可以发现,无噪声的和嘈杂的音乐信号,音乐信号检测时间的平均值11分别是2.97和6.20年代。在文献[信号检测时间的平均值12分别是4.93和7.02年代。本文算法的平均检测时间是2.63和4.63年代,分别。本文算法的检测时间显著减少,和音乐信号的探测效率改进的相应,这是适应现代音乐信号的大规模开发。
4.3。支持向量机参数的优化模型
优化算法主要曲调c和初始化参数的SVM和努力找到全局最优解通过最好的初始值。摘要three-optimization遗传算法,粒子群和网格搜索下的特征参数用于比较5倍交叉验证。
根据经验,由于cross-mutation过程的存在,基于遗传算法的优化模型(GA)消耗最多的时间,而粒子群优化(PSO)操作简单,收敛速度快,适合参数调优。因此,本文选择一个优化算法基于粒子群优化(PSO)的两个参数进行比较实验人口规模和终止代数。默认情况下获得的实验结果也适用于遗传算法在一定的范围内。首先,做对比实验终止代数,将人口规模为20,并选择50,100年,200代进行比较实验。结果如图所示8(一个)。
(一)
(b)
(c)
可以看出,与终止代数的深入,各种指标有上升趋势,但改善效果最多只有0.7%。相比之下,时间成本翻了一倍,从556年代到2218年代。考虑到识别率和时间成本,100年被选中的终止代数算法和遗传算法优化算法,然后继续考虑人口规模对模型性能的影响,并比较PSO优化算法模型与人口大小10,20,50。结果如图所示8 (b)。从10到50人口,三个评价指标都达到最佳当种群的数量是20,和识别性能显示增加然后减少的趋势。根据上面的分析结果,适度深化终止代数确实可以提高模型的性能。然而,如果样本容量很大,必须考虑时间成本。至于人口规模,它不需要盲目增加,可以选择最合适的参数根据实际的对比实验结果。最后,PSO和GA算法与100代和20人口作为初始参数和网格优化算法相比,三个算法和模型优化功能检查。实验结果如图所示8 (c)。
已经验证的分类和识别性能三个算法并没有太大的区别,和最好的PSO算法识别性能仅为0.64%高于最糟糕的GA算法。训练时间消费而言,网格是不到5分钟,远低于前两个算法。因此,最后,本文选择算法和网格的100代和20人口特征参数作为初始参数设置比较实验。图9显示了曲线由three-optimization自动搜索算法在一定的实验。
(一)
(b)
(c)
4.4。性能分析功能词的位置因素
假设功能词位置标题是最大的因素,功能词的位置因素的歌词文本的中间位置是第二步,和功能词的位置因素的两个位置开始和结束是最小的,平等的。结果如图10。TTFL算法的计算后,可以看出,虽然朴素贝叶斯模型的分类精度为86%,仍低于分类支持向量机模型的准确性。不难看到,位置仍然扮演着重要的角色在情感分类基于歌词的音乐。
5。结论
由于噪声的干扰,目前的音乐分类和检测模型不能获得理想的分类和检测结果,导致高错误率的音乐分类和检测。考虑功能词的重量的影响在不同位置的分类歌词,层次分析法是用来计算的位置重量特性在不同位置的文本标题和歌词之前,和之后的文本。为了获得更好的音乐分类和检测结果,本文首先提出了一种智能电子音乐信号的检测算法在复杂噪声的场景。去噪技术介绍,消除噪声和提取信号的特征。其次,从音频和歌词歌曲情绪的角度分析和歌词文本的独特特点,抒情情绪分析方法提出了基于文本标题和位置重量。结果表明,该模型是一个精度高、健壮的模型对音乐分类和检测和有一个非常广泛的应用前景。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称他们没有利益冲突有关的出版。
确认
本文是科学和教育的项目联合基金在2020年湖南省自然科学基金:湖南新课程发展研究原始民歌从优秀文化遗产的角度(项目号2020 j7016)(初步结果)。