文摘

实现一个成熟的作曲模式对于中国用户来说,本文分析了音乐作曲及作曲情感识别内容通过大数据技术和神经网络(NN)算法。首先,通过简要分析当前的作曲风格,一种新的音乐组成神经网络(MCNN)结构,提出了调整的概率分布的短期记忆(LSTM)一代网络通过构建一个合理的报酬函数。同时,音乐理论的规则是用来限制一代的音乐风格,实现智能代特定风格的音乐。之后,生成的作曲时频域信号分析,频域、时域非线性,。最后,音乐的情感特征识别和提取成分内容实现。实验表明:当函数的迭代次数增加,重量参数的调整和学习能力的数量将增加,因此模型的准确性可以大大提高作曲。与此同时,当迭代次数增加,损失函数将慢慢减少。此外,通过该模型生成的作曲包括以下四个方面:悲伤、快乐,孤独,和放松。研究结果可以促进传统音乐作曲智能化和影响组合模式。

1。介绍

随着经济的快速发展,中国人民期待更高的精神生活质量。特别是,在多元化的娱乐行业,音乐,作为一种社会意识形态,可以培养人们的情绪,调节自己的情绪,和巨大的现实意义。同时,音乐可以鼓励新思想和才华横溢的生活方式,它有一个强大的感染。街道和购物中心充满音乐的渲染,给人激情和快乐1]。音乐一直是受大众欢迎。自古以来,作曲家有尝试新的方法和技术来满足人们的需求。今天,在互联网时代,视频平台,动画产业,和视频游戏正在吸引越来越多的用户,在需要非常大量的原创音乐作品。然而,高质量的音乐作曲和生产通常花费太多的时间和资源,已构成巨大挑战,以满足用户的个性化音乐要求(2]。随着互联网的发展和大数据技术,一个音乐组合可以通过一个智能电脑系统自动生成,从而大大提高作曲的活力,鼓励音乐作曲家对优质作曲的灵感。此外,越来越多的音乐作品应该科学的分类和管理。值得注意的是,特定的算法可用于作曲,和思想的主流智能作曲算法利用结构性思维选择作曲的新作品,这可以减少人为因素的干扰3]。在社会经济快速发展下,音乐作品在多维变化微妙,这体现在几个方面:复调,轨道结构,和谐、速度、旋律和节奏。此外,不同类型的音乐可以通过生成这些因素的不同组合,如说唱,古典音乐,摇滚音乐4]。目前,基于智能计算机作曲,一些技术方法提出了实际应用,其中包括遗传算法(GA),音乐语法,神经网络(NN)算法(5]。

大数据的背景下,本文实现了一代的作文内容的作曲和情感识别通过神经网络算法。希望本研究可以进一步促进工业和帮助音乐家作曲的智能化生成更好的音乐。创新,四个神经网络算法来实现一个自动作曲生成模型相结合,可确保阁下和完整性生成的音乐成分,大大提高作者的音乐创造力,减少创造性的非专业人士,协助作曲家探索新的创意。

在大数据的背景下,神经网络算法已经广泛应用于各个领域。然而,神经网络的应用研究在作曲成为热门话题,由于相对较小的现有的研究具有重要意义。

麦特卡尔夫空间集成到音乐的概念和扩展心电图(ECG)通过选择组成的组合方法相关的创意设计和观众沟通与其他当代音乐的例子和趋势(6]。Herve等人发现,语义记忆和情景记忆的提取是不同的神经网络完成的。然而,这些结果通过语言和视觉空间的材料。目的是确定语义和情节的神经基础组件使用熟悉的音乐和非家族的旋律7]。金等人研究了作曲,发现自动音乐组合模型可以大大降低生产成本和非专业人士组成的阈值,从而提高音乐合成效率。因此,一个智能音乐创作的神经网络模型,提出了自动生成一个特定的风格的音乐。该模型的优点是其创新的结构:音乐序列通过演员的多空内存,然后序列的概率决定通过一个半球的过程和反馈来提高性能的音乐作品。介绍了音乐理论的规则来约束生成音乐的风格8]。王等人提出了一种新的神经网络的端到端深(款)模型对音乐自动注释。该模型有效地集成各种互补学习音乐表示完成表示,预测结构建模和标签。首先,模型学习信息描述与梅尔注意卷积网络和递归网络频谱和原创音乐波形和描述时变结构嵌入描述序列。然后,两个演示频道之间的相关性被附加音乐描述使用双重状态长期短期记忆(LSTM)网络。最后,模型聚合音乐描述序列通过自聚集成一个整体和嵌入式multiweight机制自适应获取音乐的摘要信息标签预测(9]。金发现场景音乐节目应该不断编辑最大化观众沉浸。音乐节目场景编辑的专业知识是通过开发电视节目导演(PD)。因此,音乐节目现场编辑算法,确定被测量的大小歌曲的基音轮廓和评估歌手和观众之间的心理距离10]。燕等人提出了一个基于高木涉Sugeno认知神经网络(t - s)模型与改进的遗传算法来训练网络权值。隶属函数参数调整策略结合动量法和学习rate-adaptive调整,和结果表明,组合方法可以应用到音乐识别系统和算法的识别精度高于其他算法具有良好的鲁棒性11]。高和CAI提议,借助地理信息系统(GIS)技术,设计师可以更好地优化城市区域功能定位和城市功能分区的研究大数据和GIS (12]。

综上所述,以上的研究表明,大数据的应用和神经网络在音乐领域的成熟。同时,作曲和自动识别的成分包含在上述研究是通过神经网络模型,实现对质量有至关重要的影响的音乐作品和识别精度。这里,搜索主题和内容都是基于先前的成就,和大数据的目的是探索应用技术和神经网络算法作曲和情感识别的组成内容。

3所示。作曲算法的设计

3.1。作曲风格

与社会发展和人民生活水平的提高,文化和艺术是稳步发展,和音乐,尤其是从许多方面发展,如旋律、节奏、和声、复调、结构、形式,和安排。音乐的风格常常变化不断随着时间的推移,所以音乐风格经常重叠与其他时期。从技术上讲,没有严格的音乐风格划分标准,但一般来说,音乐可分为流行音乐和古典音乐13]。

3.1.1。古典音乐的分类

古典音乐影响了几代人以其深厚的历史内涵,它反映了不同历史时期人们的感情通过其内在的情感和人文情感和已获得的立场在现代快餐娱乐文化。古典音乐可以被定义在一个广义和狭义。广义上说,古典音乐已经发展了九年纪念,它源于欧洲和西方现代文化,包括西方世俗音乐和传统教堂音乐14]。在狭义上,古典音乐也被称为维也纳古典音乐,指音乐在18世纪由贝多芬和莫扎特的作品。古典音乐有一个持久的魅力,因为它的结构、严格的形式,和完整的情感,它经历了一个长期的发展。特别是,文艺复兴时代见证了教会的权力,以及政治动荡,可怜的社会障碍,欧洲资产阶级的出现。因此,一些有抱负的年轻音乐家开始使用自己的方式来宣传一些想法,从而生传统大调和小调。稳定的欧洲巴洛克时期,音乐的发展已经进入了一个新阶段,然后四声部和谐与共鸣在古典音乐是天生的。巴洛克时期末到来后,音乐的主要形式有显著改变。当时,它更刺眼,丰富,内容与传统宗教音乐和自由。与此同时,许多优秀的作曲家巴赫和亨德尔出生。巴洛克时期的结束标志着维也纳古典音乐时期的出现,其音乐形式和结构由巴洛克时期的主导,但结合人们的情感因素,和音乐的内容变得更加丰富15]。

1820年见证了浪漫主义音乐的诞生。在那个时期,音乐与人的生活密切相关,关注的是情感表达的人类精神世界。在创作方面,音乐的形式更加丰富,情感是更受欢迎。重要的是,肖邦,并将对这一时期做出了巨大贡献,柴可夫斯基和瓦格纳已经达到了鼎盛时期,从而建立一个良好的基础发展的古典音乐。在19世纪,印象派音乐由Debu和魏本。电子音乐技术发展迅速在第二次世界大战后,国与国之间的沟通经常光顾,音乐形式变得更加开放和多元化,音乐理论的成熟,和一些模糊的音乐形式也创建,如无声的音乐,微分音乐,声乐。

3.1.2。流行音乐的分类

与其他音乐相比,流行音乐更独特。在1980年之前,流行音乐的类型是单调的,包括乡村音乐、爵士乐和蓝调。1980年之后,随着网络多媒体的快速发展,音乐风格已经有了很大的改变。在此期间,蓝色笔记也被称为蓝调。蓝调首先是由19世纪的黑人在下半年来表达他们的感情,和蓝调的音乐风格没有固定直到20世纪。在内容方面,蓝调包含绝大非洲字段的哭,以及基督教圣歌。主要风格的蓝调是表示使用字符串或等级,及其主要形式分为8条,12条,和16条,其中最常用的是12条(16]。

爵士乐是出生在20世纪初,是快节奏、全功率,这是非常特征而不是秩序,从而获得从许多音乐家和年轻人爱和尊重。相比,蓝调,爵士更丰富,包括美国音乐、非洲部落音乐和欧洲音乐、流行音乐和民间音乐。因为爵士乐有非常高的变化形式,它的内容还包括生活的所有领域,这是符合主流社会的发展。到目前为止,爵士乐的发展是最好的。

1920年,出现了一种新型的音乐:乡村音乐,出生在美国南部。作文的内容而言,主要表达了黑人的生活环境,他们渴望更好的生活。乡村音乐的早期发展主要取决于小提琴、口琴、吉他等乐器伴奏的表演者唱歌。用音乐表达:乡村音乐是由结构简单、流利的内容,和catchy-and-sweet歌词,他们大多是民谣风格,两部分的形式,或三部曲。值得注意的是,有一个很大的区别城市乡村音乐和流行音乐。乡村音乐是更稳定的节奏和有很强的乡村风味。音乐创作的主题而言,乡村音乐有以下八个方面:上帝和国家,爱,牛仔幽默,地区的骄傲,音乐,失恋,农村的生活方式,和家庭。

3.2。人工神经网络(ANN)

如今,在大数据时代,安已经成为一个重要的信息处理方法,该方法能够准确地传递神经元之间的信息。ANN算法模拟神经元的传动原理使用人类大脑的功能机制。因此,一种新的神经网络算法,即安,从神经网络的角度提出了信号处理。模型是抽象的和可以被映射到不同的神经网络模型使用不同的功能(17]。

3.2.1之上。感知器

感知器是一个神经网络模型与一个相对简单的结构基于支持向量机(SVM),但它只能处理线性二元分类问题。感知器可以模拟树突,细胞体,神经元之间的突触。虽然胞体本身的特定状态仍然是之前发送的信号影响神经元突触和当前状态,如果从细胞接收到的信息量超过指定的阈值,生成的细胞将刺激和电信号通过轴向传播到下一个神经元和突触的信号。同样,这个过程将会重演在身体每一个细胞18),如图1

1显示了单层感知器结构来模拟这个过程,在其中x1,x2,x3模型的三个输入, , , 相应的权重。后输入和权重的加权求和,最终结果y通过激活函数输出映射。

3.2.2。神经网络结构

大脑有一个复杂的结构,是由许多神经元。如果每个感知器代表一个神经元在大脑中,然后通过相互连接和组合神经网络可以建立大量的感知器,如图2。神经网络的结构包括输出层,隐藏层,和输入层;隐藏层可以分配不同的权重不同的感知器根据他们的识别能力,和输出层输出数据/信号处理(19,20.]。神经网络模型可以处理非线性问题。multiclassification问题可以使用神经网络模型与处理两个神经元的输出层。

的通过转发传播和反向传播神经网络更新信息。

3.2.3。递归神经网络(RNN)

RNN是一个环形网络结构,神经单元的输出与输入当前时刻和前一时刻的值。这种结构特征可以用于时机问题(21),如图3

RNN的计算方法可以表示为如下方程:

在上面的方程中,X代表输入数据,U表示输入层和隐层之间的权向量,年代显示隐藏层数据,V是一个隐藏层和输出层之间的权向量。与此同时,O代表输出数据,W是一个隐藏层和隐层之间的权向量。

3.2.4。LSTM网络

LSTM包含三个门的隐层结构:输出盖茨,忘了盖茨,盖茨和输入。三个盖茨可以实现U信息传输的控制。在每一个门,有一个点乘法操作和乙状结肠层。乙状结肠层的输出范围是[0,1],它可以描述多少信息传递在每个部分,其中0表示没有和1意味着所有传球(22]。(1)输入层的信息Ct计算使用方程(3),Wij代表输入数据之间的权向量和隐藏层,Wjc表示输出前一刻,重量bc表示抵消。 (2)输入门t计算使用方程(4),W表示输入节点之间的权重的门和输入信息, 代表输入通道和输出之间的重量之前的一刻, 表示输入门和细胞之间的重量在前一刻,和b是抵消。 (3)同样,忘记门计算使用以下方程: (4)细胞的状态值计算使用以下方程: (5)门的输出状态值计算使用以下方程: (6)最后,LSTM网络的输出获得使用以下方程:

3.2.5。卷积神经网络(CNN)

CNN是一个多层网络结构组成的一个卷积层、汇聚层,充分连接层(23]。卷积运算后,卷积层可以选择当地的上层的特点。在图像处理过程中,卷积操作本质上是使用卷积核图像过滤过程。图片所示的卷积操作以下方程:

在方程(9),f(x,y)代表所选图像的点灰度值在一个坐标系统中, 代表卷积核,(一个,b)代表卷积核的大小。

3.3。基于作曲的音乐作曲算法神经网络(MCNN)

在这里,一个新的MCNN结构提出了从大数据和音乐理论的视角创造。网络模型训练:LSTM代网络由输入pretrained MIDI格式的古典音乐数据库,初步指出将随机生成音乐,生成的收集音乐,音乐一代sample数据库构建和标记为0,当训练数据集被标记为1。同时,一个二进制分类模型实现,并pretrained CNN。音乐序列生成的过程中,音乐产生的序列是LSTM网络基于初始设置。不同的培训模式,在MCNN模型中,生成的音乐数据标签设置为1通过CNN和输出。输出二进制分类概率是歧视P(美国有线电视新闻网),奖励函数形成与音乐理论规则,通过加权计算和LSTM网络参数更新和调整通过奖励函数计算。音乐一代模型使用的象棋游戏。CNN希望识别标签0生成的音乐,和一代模型试图使生成的音乐和训练样本有更大程度的困惑通过奖励的优化函数进行识别分类网络的输出概率CNN接近0.5,也就是说,没有生成的样本与训练样本之间的差异,让音乐与类似的风格和主题作为训练样本。

3.3.1。作曲序列生成

音乐是一种时间序列。LSTM网络用于生成音乐序列。LSTM有特殊时间记忆功能(24,25]。基于普通多层反向传播神经网络(摘要),LSTM添加水平隐藏层的单位之间的联系。通过权重矩阵,可以连接到当前任务的信息。让训练序列的输入序列X= (x1,x2、…xT1),输出Y= (y1,y2、…yT2),T1,T2输入和输出序列的长度。然后,生成的序列yt基于LSTM网络可以通过迭代得到以下方程: 在哪里f是激活函数, 属于权重矩阵。与此同时,W初始化,然后更新迭代来实现更好的性能。

3.3.2。奖励和相似概率函数

根据音乐创作的基本标准,一个音乐评价函数,奖励,提出实时监督和调整音乐成分,从而使单个LSTM网络的不足,甚至接近作曲家创作音乐的创造性思维,并最终,满足观众的需求26,27]。奖励函数可以评估的质量产生的音乐LSTM网络、反馈评价结果生成的网络,调整LSTM网络的参数。

CNN在模式识别良好的分类性能,使用卷积内核和提取图像特征,然后通过将Softmax层输出分类结果。在网络的系统更新和优化,使实际音乐作文样本接近训练样本,建立了CNN二元神经网络模型(28]。在这里,生成的作曲样本集是标有数字1。判别概率输出通过CNN比较生成的作曲样本之间的相似性和作曲的训练样本。LSTM可以改变MIDI序列(乐器数字接口)注意到钢琴卷帘和输入到CNN模型(29日]。每一辆自行车将生成一个音乐序列,每一次音乐序列生成、文件格式转换,CNN概率神经网络模型输出相似P(美国有线电视新闻网)

在MCNN LSTM网络的更新过程和奖励网络如图4在重量参数的连续迭代。首先,战略π定义:年代一个从状态空间映射到操作空间。在时间t一代(LSTM)网络选择一个行动根据政策π在当前状态年代t生成一个报告,执行行动,转移到状态年代t+ 1,回馈奖励的行动。奖励网络评估的优势和劣势,行动计算累积奖励策略的行动序列,更新LSTM网络参数,调整序列生成策略π获得更大的回报。

Q-target的奖励网络由网络和Q-action网络。Q-target网络从Q-action复制每一个网络N一步,其价值函数读取如下: 在哪里R奖励在行动 在国家年代 显示下一个状态后行动 , 表示下一个行动。 意味着目标价值网络参数。 代表的贴现因子 是国家价值函数。蒙特卡洛树下算法年代,N 行为是基于采样策略 ,和平均回报 是获得。V的值可以计算根据以下方程:

在奖励网络行动网络的损失函数和目标网络计算 在哪里 目标价值网络参数, 代表了目标函数值的折现系数。

3.4。音乐情感特征提取

这里,情感特征提取音频信号的时域、频域、时频域,和非线性,如图5

3.4.1。音高频率

不同于普通话,音调的同一个词可能有不同的含义,和不同的音调对应不同的音高。球场是一个声学的主要参数。音高频率声音信号分析中起着重要的作用,所以常用于语音识别和音频分析。

3.4.2。短期能源

对浊音和清音短期能量可以区分声音。在数学计算,可以获得短期能源通过窗函数设置。如果x(l)设置音频时域信号,ω()被设置为一个窗口函数,那么nth帧信号xn()可以得到使用部门和窗口帧处理,见以下方程:

3.4.3。短时讨论二阶导数过零率

的次数音频波形信号通过时间轴称为短时讨论二阶导数过零率,对浊音和清音也可以用来区分声音。无声的声音一般出现在高频波段,并讨论二阶导数过零率通常是更大的。相反,表示声音一般出现在低频带,和表示的讨论二阶导数过零率更小。短时讨论二阶导数过零率Znnth帧信号xn()可以使用以下方程:

下面的方程,胡志明市代表符号函数。

3.4.4。MFCC (Mel频率Cepstral系数)

梅尔·过滤器银行类似于人工耳蜗模型,可以积极回应的频率信号的各种声音。在实际的环境中,人类的感知声音大大不同在不同的声音频率范围(30.]。当接收到的声音信号的频率低于1000赫兹,声音感知和信号频率是线性关系;相比之下,当接收到的声音信号的频率高于1000赫兹,两者之间的关系是对数,见以下方程:

在上面的方程中,f代表实际的频率和梅尔(f)表示的频率被人类的耳朵。

4所示。实验结果分析

4.1。分析音乐合成的结果

6显示了音乐频谱。图7说明了不同的迭代次数的影响结果。

6显示隐藏层LSTM细胞越多,越强LSTM网络可以学习抽象的数据特性和缩小之间的差距的目标价值和预测价值。同时,隐层的维数也严重影响实验结果:隐藏层的数量增加时,神经网络的计算将会飙升。重量参数的连续迭代有很大影响一代作曲和损失函数的结果。结果如图所示6。数据图的变化6意味着更大的迭代的数量,重量参数的数量越多学习和调整,这能提高模型的模型精度t。和迭代次数的增加,损失函数的下降逐渐减慢。不可避免的是,过多的迭代也会带来更多的计算。

4.2。MCNN算法的测试结果

8说明了时域波形生成训练样本和样本下MCNN算法。

8表明变化的频率分布波形的作曲MCNN算法和训练样本生成的波形是相似的,所以MCNN算法可以学好训练样本的内部结构。图9说明了三个音乐作曲算法的比较结果,VAE-GAN, GAN和RL-RNN。

9意味着,与其他算法相比,生成的作曲提出MCNN算法可以实现high-sample通过率,这是远远高于GAN和VAE-GAN略优于RL-RNN算法。因此,生成的音乐MCNN算法可以确保作曲的完整性。作曲模型建立与大数据学习和音乐成分具有较高的实用性。

4.3。音乐情感识别测试

10节目的有效性测试音乐情感特征提取和分类算法。

10显示器的声谱图特征、频域特征、赫斯脱线性参数和时域特征分析起着重要的作用在作曲。与此同时,在音乐的分类和识别,应该减少决策树分类性能较差。自动生成的音乐组成包括四个方面:悲伤、快乐,孤独,和放松,,伤感音乐占了。

5。结论

这里的音乐作曲及作曲情感识别内容是使用大数据分析技术和神经网络算法。基于RNN的分析、LSTM和CNN,基于MCNN自动作曲模型建立。同时,情感特征提取和识别通过作曲的四个方面内容:时频域、频域、时域非线性,。结果表明,LSTM细胞的数量越多隐层结构,较强的学习能力LSTM抽象数据特性的网络,和窄目标价值和预测价值之间的差距。音乐的频率分布成分MCNN算法生成的类似的训练样本,从而证明MCNN算法可以学好训练样本的内部结构。此外,自动生成音乐包括以下四个方面:悲伤、快乐,孤独,和放松,,伤感音乐占了。尽管如此,还是有一些限制。增加迭代将带来大量的计算,隐藏层的数量的增加也会放大的计算模型。因此,在未来的研究中,应该选择一个更高效的算法减少计算模型的工作。

数据可用性

使用的数据来支持本研究的发现可以从作者要求。

的利益冲突

作者宣称没有利益冲突。

确认

这项工作是支持的周口职业技术学院。