文摘

传统民间音乐是建立在传统的民歌。爱国主义的五种情绪,乡愁,感情,友情,和爱情都是中国现代民歌中描述,展示丰富多彩的情感的各族人民在中国。中国现代民歌表达这些情绪有多种艺术特色的旋律,节奏,模式,和情绪,为观众提供独特的审美体验。本文基于JTFA——(联合时频分析)情感传统民歌的分类,以及PCA(主成分分析)和KPCA(基于主成分分析)的非平稳信号特征降维的方法。仿真结果表明,在KPCA特征的数量小于在PCA相同的精度。当特征的数量等于主成分的数量,精度高于主成分分析,表明在降维KPCA有更好的效果和特征提取。此外,在所有类别,双层分类模型保持相对较高的召回率和准确率,证明双层multimusic情感分类模型的有效性。

1。介绍

音乐是一个传统艺术,非常善于表达情感。这已经被许多的美容师和音乐家证实在现代1]。音乐是善于表达情感,因为它的存在方式和形式类似于情感。随着传统民歌的出现,人们有一种方式来表达他们的思想,情感,或要求和愿望。口头传统民歌通常创建,他们也通过口头和集体不断加工和修改,最终形成一个派系有自己的特点,有一定的社会功能,反映了其不同的社会特征在不同地区,不同时期,不同的社会状态2,3]。传统民歌代表一个国家的文化,一个时代的记忆。随着时代的发展,传统的民歌逐渐淡出人们的视野;因此,我们必须记住传统民歌和继承经典4]。然而,为了更有效地寻找传统民歌,传统民歌的分类是特别重要的。

情感是一种一维动态艺术流入时间;情感取向、持久性、频率、速度、强度、以及其他方面是多种多样和多变的,而音乐有多种模式,音调、节奏、速度、声音,和强度(5]。可以看出,情感因素的研究在传统民歌在中国仍然是一个需要深入讨论的话题。咨询后大量的材料在情感因素在传统民歌,然后扩大到传统民歌的研究资料的收集,包括各种书籍、杂志和网站相关的传统民歌,我发现很少有研究的书籍和文章情感因素在中国传统民歌。不到5%的歌曲体验歌手的情感变化结果的解释6,7]。鉴于上述,文本的情感分析已逐渐转移到基于歌词的情感倾向分析近年来,使基于歌词的情感倾向分析流行。因此,本文从传统民歌的歌词(8]。而不是处理单一的时域或频域信号,JTFA方法结合了两个,允许信号在时域和频域都在同一时间。整个信号的成分可以通过变换,便于提取信号在三维空间的变化特征9]。JTFA(联合时频分析)已被应用在各种领域,包括生物医学信号、语音信号、机械振动信号。

然而,该算法基于短期特征只考虑短期光谱或能量的音乐,这是更适合一些传统音乐信息检索任务,如识别和分类,但不是对于某些应用程序,如音乐结构分析和声源分离,必须考虑音乐的光谱特征以及其分布和变化。为了解决这些问题,研究人员通常采用第二种类型的音乐信息检索算法,即JTFA-based方法(联合时频分析)。本文的目的是将情感在传统的民歌中,结合现有的音乐情感分类10,11)标准,计算其权重使用有效的特征融合和一个极端值表情感词汇,和法官的传统民歌的情绪。

事实上,在中国现代民歌,五个主要情感密不可分,彼此集成,一个变成另一个。这些特征可以反映出不同的性格特征,文化背景和审美喜好的人在不同的位置。传统民歌是一个取之不尽的信息来源为感兴趣的人了解历史,社会和生活。S-VSM(情绪向量空间模型),提出了在文献[12),结果明显改善。文献[13)与上述学者的研究方法的不同之处在于,它使用一个情感词典获得情感语料库词。文献[14)使用神经网络提取情感特征,然后分类样本,和分类精度达到89%。文献[15)提出了一种文本分类器基于该混合模型。在英语文本分类实验中,该混合模型实现高精度通过结合两个常见的深度学习模型:稀疏autoencoders和深层的信念网络。无监督学习方法的趋势判断的观点讨论了文献[16,17]。这个方法从文本中提取形容词和副词,估计他们的情感倾向,然后计算出整体的情感倾向基于这些词的平均倾向。多畴的数据,这个方法平均准确率为74%。

情绪判断的另一种方法将这视为一个分类问题,然后使用机器学习来完成分类。区分事实陈述和情感表达、文学(18)采用多种模型。文献[19)已经取得了一些进步在分类过程中,引入了分层情感分析过程,不同于以前的工作的做法直接分类的音乐。完成这项任务的音乐情感分析,他们使用一个两阶段的方法。在文献[音乐家情绪分为六大类20.),音乐情感分类研究使用spectrum-related信息作为特征。根据文献[21),音乐情感的分类应该从离散回归和音色的特点,提取的音高和音量的音乐。音乐作品的坐标Valance-Arousal情感坐标系计算利用SVR(支持向量回归)模型,然后,音乐作品转化为情感类别。音乐信号的频谱分为部分波段,一些频域特征提取,部分波段音频特征和non-sub-band音频特征融合,最后,一个支持向量机分类器是用于训练和分类,根据文献[22]。

JTFA方法能够准确地提取非线性信号的时变特征信息和准确提取非线性信号的重要特征,弥补缺点的时域和频域分析方法。STFT(短时傅里叶变换)、小波变换、能量分布、和经验模态分解是最常用的一些JTFA方法。语音分析、图像识别(23- - - - - -25),生物工程,机械设备故障诊断和其他学科和工程领域都使用这些方法(26]。

3所示。研究方法

3.1。音乐特征提取

传统民歌音乐和文学的总和。他们是情绪的直接体现,是一种情感。它是一种态度、情感、感觉和反应的人事物,可以表达。或者因为好的音乐可以引起观众的共鸣,有一种感觉想跟随音乐的节奏。好的歌词能表达歌曲的情感淋漓尽致,引起观众的共鸣。在以前学者们的研究,主要是由音频特征提取,但没有取得好的结果。

传统民歌的情感特点是受生活环境和通信模式。传统民歌有现实生活中的主题和劳动人民的精神生活的重要组成部分。这是人们表达他们的情感23]。传统民歌是民族文化的精髓,因为它们封装一个国家的精神,性格,气质,和心理特征,以及具有独特的民族特色和地方色彩。由于传统民歌歌词的白话,分词的准确性会影响情感分析的准确性。英语单词之间的空格作为间隔标志,他们使用相对简单。词与词之间没有明显的分离马克在中国25]。只有句子之间的界定(标点符号)。表现力的音乐的基本元素在每一段音乐各不相同,这也解释了为什么音乐可以表达不同的情感。例如,音乐类别的快乐和热情有明亮活泼的音色,温暖和欢快的节奏,和大多是主要的基调;愤怒和易怒的音乐有一个深刻而沉重的音色,紧张和快速的节奏和基调,主要是次要的。

本文将利用音频信号处理来区分不同的音乐表达的情感。从上面的分析,可以看出音乐的基本元素控制音乐的情感表达。因此,音乐的基本元素映射到音频特性,为后续工作奠定了基础(图1)。

总之,通过建立音乐情感表现力和音乐的基本元素之间的关系,然后将音乐的基本元素映射到音频功能,音乐情感表现力和音频特性之间的关系终于建立,为后续工作奠定了基础。

从的角度音频信号处理、特征提取的音调需要分析频谱,和彩度向量特征和模式特征是最好的特性描述音乐模式。时频域变换采用常数Q变换,推导出色度特性的解决方案在频域常数 转换和滤波器组 变化规律设计,每个滤波器的中心频率 在哪里 滤波器的中心频率最低的银行,本文选择了220赫兹; 是过滤索引号。 是滤波器的数量/每八度水平。

互相关函数可以计算之间的交换能量信号 和量化这个交换能量,获得两个信号之间的相似性。互相关函数的公式如下:

在这 用于消除时间偏移量。

从数学本质,数据空间,功能空间,和类别空间可以连接在一起,它们之间的非线性变换可以通过内核处理完成。如果有一个映射函数表示数据空间和功能空间之间的关系,调用这个函数 ,然后内核函数的功能是实现矢量的内积变换:

当然,如果您想要使用内核函数,你必须符合以下条件:对于任何原始数据的功能 ,对于任何函数 , 不等于0和满足

当应用核主成分的非平稳信号,样本数据应该分为训练集和测试集。规范化数据,然后得到核函数矩阵,然后得到核函数矩阵的特征值和特征向量在高维空间中,选择第一个几个主要特征向量构成一个特征空间,和项目的训练集和测试集到此功能空间。最后,将训练集输入支持向量机进行训练并验证模型与测试集。

KPCA的实现过程(基于主成分分析):非线性映射 完成了从输入空间变换到特征空间。最后,使用PCA过程映射数据。

假设有一组观测值 ,首先分散观测值 ,然后主成分对角化协方差矩阵

对于一般的PCA方法,是解决下列方程特征问题:

解决特征值大的贡献率和相应的特征向量。

传统民歌是一种歌曲,人们在社交场合创建口头来表达他们的情感。它是由劳动人民口头传播,不断处理,最终形成和传播的歌曲与相应的特征。传统民歌也有利于人们的富有成效的工作。唱在生产劳动的出现极大地鼓励人们向上的信心生活工作。因此,它也是一个劳动人民从事生产劳动的必要项目。

3.2。情感分类的传统民歌

中国是一个文明大国,地域辽阔,民族众多,历史悠久,它有一个非常丰富的音乐文化遗产。它有各种各样的不同民族和地区的传统民歌。每个传统民歌传播和口碑传播,这是一个社会的各级社会活动。

传统民歌真正反映人民的愿望。传统民歌超越自己的音乐的特点,使我们更接近一个国家的灵魂。这是一个永无止境的传统民歌的供应。音乐在这个领域已经扩展到不同程度的表达所有类型的特殊的情感。所有灵魂的情绪,包括快乐、幽默、轻浮,任性,得意洋洋,以及焦虑,担心,悲伤,痛苦,忧郁的不同程度,甚至情绪像敬畏,敬拜,爱,属于音乐的伞。

情感需要宣泄和释放,人类是这个需求的外部表现。其音乐语言表达密切相关,它是表达的基础通过允许将表达运动转化为音乐音调。传统民歌歌曲书面口头相传。它有一个独特的特性,这是表达情感的能力。传统民歌可能缺乏严肃、庄严和曲折,但他们是极其罕见的和有价值的能力来表达情感。

只在歌词可以促进情感词的情感倾向的歌曲,根据基于字典的情感分类方法,程度副词和否定副词修改情感词的情感词汇的影响强度和趋势。以下假设支撑字典方法摘要:否定副词和程度副词改变趋势或情绪词的情感通过修改最亲近的人。当一个否定副词出现孤独,情感词的极性修改通常是逆转,而当一个程度副词出现孤独,情感的强度通常是增加或减少。

假设中包含的独特情感词的情感 被表示为 ,和它的情感价值 是1,-0.5和0.5.1的情感词典。此外,定义了负面因素,表示 ,这表明情感倾向或情绪的变化程度造成的消极的副词,和程度的因素是表示

然后,的情感价值 可以通过公式计算(6):

包含 情感单元,构成一组 ,也就是说, 最后,所有句子的情感价值和情感价值 的歌 ,见公式(7)。

好音乐使用的长期特征分类如音高、节奏,体积将音乐分成不同的情感类别。第二层的音乐情感模型包含两个细分类模型,即明亮的系统分类模型和黑暗的系统分类模型。bright-system分类模型输入数据确定bright-system音乐的第一层粗分类模型。黑暗的系统分类模型的输入数据判断黑暗音乐的第一层粗糙的分类模型。该模型处理第二个分类问题,用于区分愤怒和易怒和恐惧和悲观情绪。

射频(随机森林)模型是基于模型集成的设计思想,及其核心思想是引导聚合(装袋),这是一个机器学习的算法模型集成,针对提高分类模型的稳定性和准确性在统计分类和回归的任务。射频的决策树模型需要完全分裂,因为适当的模型的拟合程度是保证通过两个随机抽样过程。

因此,射频模型已经建立。每个决策树模型的精确度不高,但是不同的决策树是相互独立的,他们扮演一个好的角色区分数据样本在一些狭窄地区(特性)。装袋集成后,射频模型与高稳定性和准确性终于获得。原理图如下图2

SVM(支持向量机),结构风险最小化的想法,是在支持向量机实现,它是一个机器学习方法。目前,这项研究是非常受欢迎的,也是最新的统计学习理论。

它可以证明了拉格朗日系数 大多数样品将是0,具有非零值的系数是相对应的支持向量样本。解决上述问题的最优解,最优函数如下:

分类阈值。一般公式(8)也可以获得通过的任何一个中值两种支持向量。

基于高斯径向基核函数的支持向量机现在使用最多,这也显示了最佳性能(12),其表达式如下:

可以看出,这个内核函数可以将原来的有限维空间映射到一个无限维的空间通过非线性内核,并表达参数的值 是非常重要的。如果 高阶特征的重量太大,将会迅速衰减,结果等价于一个低维空间,使成为一种样品。

然而,如果 太小,可能会有严重的过度拟合问题,因为在这个时候,随机数据将被映射到线性可分的。因此,选择合适的参数值的高斯核函数显示高灵活性。

4所示。结果分析和讨论

这是一个广泛的音乐流派,包括歌曲和音乐,而不是纯粹的诗歌或器乐。它的艺术价值,它结合了音乐和文学,它为人们提供了一个新的审美体验。情感的表达在传统民歌是具体和细致。每一个传统民歌包含过多的情感元素。大部分地区民族民间音乐是传统民歌。传统民歌在不同的地方有不同的特点,但是他们的情感表达是一样的:会有喜欢,悲伤,愤怒和厌恶。人们应对真正美丽的音乐会,和传统民歌有这个质量。形式上,歌曲唤起怀旧经常使用进步的旋律线的旋律振幅不超过两个八度。旋律是相当温和的和放松。密集的节奏,指出,持续的时间比较短,比改变更频繁。 To express quiet and gentle emotions, the majority of them use minor tunes. This type of emotion is often expressed unilaterally at first, but it is bound to elicit a response in order to gain understanding, and the expression of this emotion evolves into communication over time. Communication has many different aspects. Singing is a way to express love that dates back to human nature’s most basic needs.

音频特征选择本文可以分为两个类别在信号处理方面:短期特征和长期功能。它们之间的差异是由于不同的帧长度的计算中使用的音乐信号。短期帧(50 ms每帧)用于计算短期特征,虽然长期框架用来计算长期特性(5 s)。有必要把短期和长期的特征来训练分类模型。因为对短期和长期功能需要不同的计算时间,短期和长期的尺寸特征矩阵计算同一段音乐是不同的,从而无法拼接矩阵和矩阵直接形成一个完整的功能。因此,特征融合用于解决这个问题。每个单层分类模型接收特征融合短期和长期的特征作为模型的训练数据训练。通过培训获得的总体分类精度与单层分类模型如图3

从图可以看出3摘要(BP神经网络)是一个深度学习算法,具有更好的总体分类精度。射频属于集成模型,它使用的想法装袋组合模型和集成了几个树模型。这种方法也取得了良好的总体分类精度。总之,摘要和射频模式取得了良好的总体分类精度。

4显示每个分类模型的召回率为每一个情感类别。

当看着每个情感类别的召回率,可以看出这两个类别的快乐,热情,和愤怒和易怒称利率上升,表明该分类模型有更高的识别程度对于这两种类型的音乐,表明更高的识别能力;然而,召回率的恐惧和悲观情绪很低,表明分类模式识别能力差这一类。而其他模型在这一类表现不佳,摘要的能力来识别最好在安静的音乐,悲伤,和失去的类别。

传统民歌的抒情性,当然,不仅爱,也指对祖国的爱,社会,家乡,父母,和孩子。情感是在传统的民歌中,最常见的因素是最重要的因素在传统民歌。从内容的角度来看,怀旧歌曲主要是描述人们的向往,怀旧,附件,和爱家乡的风景、民俗、专业(尤其是那些已经离开家乡很长一段时间)。它们可以分为两类基于强调情感表达:第一个是歌曲表达乡愁。这个流派的音乐注重表达的渴望和怀旧的流浪者或本国侨民在国外。

KPCA,相同的数据,比较不同的内核函数和选择不同的特征值,并比较每个内核函数的分类结果如图5,6,7

对比以上数据,可以得出结论,当径向基函数具有相同的特征值,分类的结果是最好的。从图可以看出6,培训P-order多项式核函数和线性核函数精度非常高,但分类结果不高。与相同的特征维度,发现第一主成分贡献率P-order多项式核函数和线性核函数过于集中,达到99%以上,不利于分类。

它还可以看到高斯KPCA可以获得更少的特性,比PCA更有效,表明KPCA比PCA对平稳信号具有更好的分类效果。

高斯内核用于支持向量机。当执行分类训练,不但要参数 确定,而且确定重量参数 ,叫做错误惩罚系数和代表的偏差度不正确的样品。的大小 需要适当的选择。如果数据较大,拟合程度较高。然而,如果数据泛化能力弱,小,复杂性将减少,但它可能会导致大的经验风险值。

本文解决的非平稳非线性信号的分类问题。对于分类问题,特征提取是关键,这是相关的分类器的性能。分类器的性能可以直接验证实验原理的正确性。系数的能量特征提取,提取的能量特性受到内核不同核函数的主成分分析。主成分分析后,得到重要特征值,然后,分类问题就来了。图8显示了分类结果的非平稳信号。

在分析的总体性能分类模型在过去的两个部分,这部分分析和比较每个情感分类的准确性。图9显示每个类别的每个分类模型的性能。TL_C在哪一个两层的音乐情感分类模型,SLN_C单层神经网络分类模型,和SLR_C单层射频分类模型。

双层模型的指数略高于SLN C模型和远高于RF模型安静和柔和的音乐。的性能水平双层模型和SLN C模型在悲伤和失去了类别的音乐相当平坦,和两个模型有更好的能力来识别正样本和区分负样本,这是比这个类别中的射频模型的性能。

两层分类模型是略优于射频模型愤怒的音乐,和两层模型的准确率约为3%高于RF模型。恐惧和忧郁的音乐类别,SLN C模式识别率很低,而其他两个模型有较高的识别率。双层分类模型精度略高于RF模型(少于2%)。总结,双层音乐情感分类模型具有良好的识别能力积极为每个情感类别样本,以及一个好的区分能力负样本,每个类别的准确性是保持在一个相对高的水平,证明它是比SLN C和射频更健壮和突出。

5。结论

最广泛的表达内容在传统民歌是情感,这是由不同民族共享的人类,如亲情,友情,爱情,或乡愁。快乐,愤怒,悲伤和快乐都在它,从它的长度短,有一窥一个色彩缤纷的世界。JTFA基础上,本文深入分析和研究的情感表现力的音乐信号,链接音乐情感与音乐元素,并将其映射到相应的音频特性。音乐信号的时频域特征与不同的情感进行了研究。基于公共字典是一种情感分类系统,可以自动获得情感的单词。基于实验数据,双层分类模型的总体分类精度而获得最好的单层分类模型。双层分类模型更加健壮的和优秀的音乐情感分类的任务,这证明了双层分类模型的分类是有效的音乐情绪。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者没有任何可能的利益冲突。

确认

本文是一个阶段性的成就的“13日五年计划”项目2018年湖南省教育科学“改革和实践高校流行歌唱教学旨在培养创作歌手”。不。(XJK18BTW003);本文的阶段性成就2020年湖南省高等教育学院的课程思想政治建设研究项目”的道德教育价值的研究在我国传统音乐的指导下习近平对文学和艺术的看法”(hnkcsz - 2020 - 0624)。