数学杂志

在这一页上

文摘介绍相关工作结果结论数据可用性的利益冲突引用版权相关文章

特殊的问题

新方法在图和因数据分析和处理

把这个特殊的问题

研究文章|开放获取

体积2021年| 文章的ID7164817| https://doi.org/10.1155/2021/7164817

流行歌曲组成基于深度学习和神经网络

小君旷¹ 和Tingfeng杨 ¹

学术编辑器: Naeem简

收到了 2021年10月26日

接受 2021年11月24日

发表 2021年12月22日

文摘

对于公众,组成似乎是专业和阈值相对较高。然而,自动组合可以改善这个问题,让更多的普通民众参与成分、特别是流行音乐成分,所以音乐变得更有趣,它的随机性也可以激发专业人士。本文结合深度学习提取注意功能的演示音频和构建神经网络模型完成了流行音乐的成分。本文的主要工作如下。首先,我们提取特征笔记,画的设计过程mel-frequency cepstral系数提取,并结合钢琴音乐信号的特征提取的注意特征展示音乐。神经网络模型,利用循环神经网络的记忆功能和处理序列数据的特点,钢琴音符组合成一个序列根据音乐理论规则,和神经网络模型自动学习这个规则,然后生成注意序列。最后,理想的流行钢琴音乐成绩分为在线音乐爱好者分数和离线专业评级。获得评分指数,每个指数加权熵权方法。

1。介绍

播送的精神和文化需求的人迅速增长,由于我国经济和社会的发展和物质生活水平的提高。结果表明,多层次的特点,多形式多样化,文化消费能力大大增强,欣赏水平的不断提高。人类的音乐艺术反映了真实的情感。它能帮助人们找到他们的思想的内涵。此外,它将最诚挚的共振和权力。因此,音乐的艺术中扮演一个重要的角色在人们的精神世界。

钢琴有一个华丽的声音,广泛,充满变化,强烈的表现力。钢琴在音乐创作中占有重要地位和彩排由于其丰富的音乐理论的表达能力。目前,人民音乐工作需要专业知识的基本音乐理论、音乐风格、和谐、等,为了创建音乐成绩标记速度和和弦等基本内容。作曲家往往不认为从稀薄的空气中当他们作曲。最喜欢用吉他或钢琴作曲家创造在玩。成品通常乐谱,将标记速度和和弦等基本内容的安排以及风格的音乐和一些基本的想法1]。对于普通用户来说,组成的专业和阈值太高了。

超过60年的进化之后,由新理论和技术,如移动互联网大数据、超级计算、大脑科学和社会发展需求,人工智能加速了它的发展,显示新功能,如深度学习和跨境整合(2,3]。近年来,人工智能领域的发展迅速组成、突破人类工作的约束音乐,所以人类需要掌握深厚的音乐理论。人工智能能够创造新的音乐和提高效率的音乐创作和音乐的表演。国内外科技巨头也明显的商业化这一领域的实践,和他们的一些作品可以通过图灵测试,达到一个级别,普通用户无法区分。

本文的选题的意义如下:(我)首先,促进音乐学习者更好地了解流行音乐领域。这可以通过分析流行音乐钢琴创作。(2)其次,流行音乐和深度学习的结合建立了人工神经网络钢琴自动组合方法。这将给歌曲创作者灵感,所以,人们通常可以参与创造的流行音乐,积累大量的流行音乐钢琴作品,给流行音乐,为音乐创作带来更多的可能性。(3)第三,合格的和有能力的钢琴教育者应该使更多的创造和尝试更多。为此,他们必须掌握和创造学习钢琴技术的流行音乐,流行音乐钢琴创作融入自己的钢琴教学中,钢琴学习的兴趣,提高学生的创造力和音乐。此外,他们的整体音乐素质,合作,沟通能力将提高4]。

以下部分强调的一些相关工作。部分3描述了方法的研究。节4、实验结果分析和部分5总结了研究。

目前,搜索关键字“流行音乐”与这个话题有关,我们已获得超过1000 CNKI的有关文件;Wan F数据库收集了超过400相关艺术的文章。作者认为,这里的“流行”不是简单的定义为广大,其前提来自区域的划分(5]。美国爵士乐还是中国流行音乐,无论是格什温的《蓝色狂想曲》或李江H“细雨”,这属于流行音乐的范畴。流行音乐包括流行音乐,轻音乐,爵士音乐,摇滚音乐等等。流行音乐的相关文献进行了回顾,作者发现,流行音乐领域有其独特的魅力。作者认为音乐没有国界,但是流行音乐有它自己的边界。根据文献研究,现代中国流行音乐的发展始于“学校音乐和歌曲”在学校推广。在1930年代和1920年代,流行的抗日群众歌曲,激发了人们的战斗精神在战争中发挥了巨大作用。同时,建立城市音乐由李J H也大大发展,这促进了现代流行音乐领域的发展我们的国家。虽然那个时代的符号技术和媒体都相对落后,大多数人欣赏广播的形式,但作为一个象征性的时代的产物,它的存在本身就是交际。如今,流行音乐的发展非常迅速,传播和程序的形式也多样化。 Music from all over the world can be communicated with each other through television, the Internet, and other means, and it is spread widely. While preserving the classics, the repertoire is updated very quickly. From the perspective of current music culture, it can also be found that popular music repertoires have also come to the fore in various competitions and are loved by the masses.

早在1960年代,试图将计算机与传统音乐。1956年,希勒和艾萨克森创建了世界上第一个弦乐四重奏,完全是电脑(6]。著名的音乐情报系统EMI是由教授大卫·应付。它使用一个模式匹配算法来提取音乐作品和音乐序列特性分配相应的权重根据出现的频率特性。最后生成的音乐风格类似于原作风格7]。马尔可夫链在概率论与数理统计(马尔可夫性质8]。许多学者用马尔可夫链来研究算法组成。Visell使用隐藏的马尔可夫链来实现手动优化实时音乐系统(9]。遗传算法是在生物进化计算模型,可用于引用在人工音乐创作10]。许多相关研究使用遗传算法实现作曲。选择一个和弦的GenJam系统由胆汁。基于这个和弦,可以创建一个爵士独奏的旋律。该系统功能互动即兴创作的11]。

人工神经网络是一种计算模型,模仿神经学和生物学。广泛应用于音乐创作系统,取得了一定的成功。艾克和Schmidhebuer LSTM最初探索音乐的创作。相比之前的音乐创作与RNN只能获取音乐的局部结构,LSTM可以捕获和繁殖的长期音乐结构,最后生成音乐可以按照弦法(12]。富兰克林LSTM用来学习音乐知识;考虑到音乐结构的协调,最终的模型可以即兴创作一段音乐13]。史密斯和加内特深层神经网络使用强化学习模型生成音乐和提高音乐作品的质量通过创造力14]。

3所示。方法

在本节中,提出的方法研究解释说,比如音频文件特征提取和自动组合神经网络模型结构。

3.1。音频文件特征提取

提取音频文件功能分别照亮。分类是基于功能。

3.1.1。Mel-Frequency Cepstral系数(MFCC)

音乐信号和语音信号有相似之处。语音识别和语音领域的重建,mel-frequency cepstral系数(MFCC)通常用于提取语音信号的特征(15]。MFCC考虑了人耳的听觉特性,但不考虑到音乐和音乐理论特征。短时傅里叶变换中使用MFCC提取。短时傅里叶变换是最常用的时频分析方法,它可以用于处理非平稳的信号的频率随时间变化。具体来说,原始信号分为许多时期一个窗口函数,并需要对其进行傅里叶变换在每个时间段(16]。短时傅里叶变换)在1946年提出了伽柏。对于一个连续信号 ,STFT定义如下: 在哪里是窗口函数。选择窗函数的长度影响的时间分辨率和频率分辨率。窗函数的长度越长,越时间分辨率和频率分辨率越高在傅里叶变换;相反,窗函数的长度越短,更好的时间分辨率和频率分辨率差17]。

3.1.2。Cepstral系数提取

图1显示了整个MFCC提取的流程图,每一步的将在下面解释。在第一步中,输入原始信号分为帧,然后每一帧信号处理得到每一帧的信号吗然后进行傅里叶变换:

一系列的转换是进行上述方程,和MFCCs提取:

3.1.3。注意特征提取

本文提取钢琴注意功能,指MFCC特征提取的过程中,并使用一个基于过滤器算法提取基频。滤波器的设计原则是指twelve-average法律因为每个键的钢琴调根据twelve-average法(18]。提取流程图如图2。

3.2。自动组合神经网络模型结构

部分分为两部分,即。,the recurrent neural network structure and automatic composition neural network model.

3.2.1之上。递归神经网络结构

与一般的前馈神经网络相比,递归神经网络的结构增加了反馈链接隐藏层隐层(19]。将会有一个递归神经网络的输入在每一个时刻,然后计算一个新的状态根据隐层的状态在 ,最后输出。输出层的计算公式如下:

从方程可以看出,神经网络的输出值取决于前面的输入值,同时也表明,循环神经网络具有记忆功能。因此,循环神经网络选择的神经网络模型的基本单位钢琴自动组成。

3.2.2。自动组合神经网络模型

钢琴音乐是由多个序列音乐理论指出按照一定的规则。神经网络可以学习这个隐藏的规则,然后预测和生成注意序列实现自动组成。从之前的分析,可以看出,循环神经网络记忆功能。理论上,它可以建立国家间或之间的依赖关系。然而,有一个问题的梯度爆炸或消失在实际训练。一个简单的神经网络模型很难这样一个长度的依赖。钢琴自动合成过程分为两个步骤:第一步是使用注意序列数据集来训练神经网络模型,经过多次的学习和训练,一个好注意预测网络模型。第二步是使用注意预测网络模型来生成一个注意序列,与钢琴声源匹配,得到一个钢琴音乐的音频格式。培训过程中不会被详细描述。后自动组合神经网络模型的训练过程完成后,一个好注意预测网络模型将获得。 The note prediction network model can be used to generate a specified number of note sequences. The note value predicted by the note prediction network model is also used for calculation by the softmax function, and the note category with the largest probability value is selected as the final actual predicted note output [20.]。注意预测网络模型生成报告X如下:

整个合成过程是先指定的输入音符序列的输入层注意预测网络模型。注意预测网络模型生成一份报告,预测的安排米*为了获得一组注意序列,生成和分配注意序列的乐器。钢琴,声源同时称,最后获得了钢琴音乐的音频格式。合成过程如图3。

4所示。实验和结果

在这项研究中所有数据来自ADNI1数据集。本节详细介绍了施工过程的自动摘要组成的神经网络模型,训练规则,自动生成钢琴音乐的过程。结合这个示范音频设置的特点,经过多次实验结果比较,最后自动组合神经网络模型将需要使用特定的参数值。自动生成钢琴音乐的过程中,注意预测网络模型将生成一个注意,每次安排产生的400 400预测为了获得一组生成序列,分配注意序列作为钢琴乐器,使钢琴声源同时,最后得到的钢琴音乐音频格式。

4.1。在线试听的结果评价

在线试听效果评分平台采用的开发方法分离前后结束。前端开发的反应,后端用Java (21]。平台的开发完成后,20测试钢琴歌曲放在平台上,其中五个是音频集合的演示作曲家之一。五是音乐网站,十是由组成神经网络模型自动生成的(22]。每个钢琴作品的持续时间30秒,以避免被拦截审计师的听觉疲劳。我们邀请了测试人员听10钢琴音乐在线和评分,评估他们根据他们的主观听的感觉。评分标准如表所示1。

共有20个音乐爱好者被邀请参加这个测试,每个钢琴歌曲的分数统计,平均得分是计算,最后得分排名如表所示2。

在上述的最终评价得分结果,自动生成的钢琴音乐Demo_17成分进入前三名,和许多Demo_11 Demo_06歌曲也排在前面的两个工作。自动生成下一个得分是钢琴音乐在这篇文章中,这表明,自动生成的钢琴音乐的质量是不同的,和自动组成的网络模型进一步优化的空间。得分高于3的比较如图4,得分4以上的比较如图5。

4.2。线下面试评估的结果

离线性能评估在钢琴表演邀请专业人员具有丰富的经验。专业人士有指定的5个指标评价,即“旋律、纹理、和谐、张力和美学。“每个指标的满分是100分。然后执行10钢琴歌曲,钢琴歌曲记录5的评分指标。最后,每个钢琴歌曲的前十名成绩表所示3。分数高于80的比较如图660岁以上,分数的比较如图7。

从最后的得分情况,自动生成的5钢琴歌曲在本文中已经进入了前十,表明自动生成的钢琴音乐在本文中可以达到的水平一般手动创建,但与著名的作曲家舒曼的作品相比,比分差距很大。两个最低分数也自动生成的钢琴音乐在这篇文章中,这表明,自动生成的钢琴音乐的质量是不同的,和自动组成的网络模型需要进一步优化。专业人士还当场评论,钢琴音乐自动创建在本文中是单调的,没有复杂的变化,缺乏“节奏”。

从结果可以看出,自动生成的钢琴音乐只占5%的得分80分以上,和其他占25%。60分以上,自动生成的钢琴音乐占35%,其他占50%。

5。结论

当前的研究首先介绍了实验软件和硬件环境,示范的源音频和训练集的大小后提取注意功能。之后,详细描述了建筑的自动组合神经网络模型训练过程和具体的参数。自评估质量的自动创建钢琴音乐是一个难点,本文提到以前的研究和采用主观评价方法进行图灵测试。此外,音乐爱好者被邀请去听为了评估在线和专业离线性能评估,分别。在线试听效果评分平台采用的开发方法分离前后结束。前端开发的反应,后端用Java。我们邀请了20 20钢琴音乐爱好者听网络歌曲。然后,我们要求他们如何,分数,并评估根据他们的歌听的感觉。评分结果表明,测试人员不能完全区分人类工作的音乐钢琴音乐在本文中自动生成。它也表明本文中的钢琴音乐自动生成满足的欣赏要求测试人员。 The offline performance evaluation invites professionals. The professionals specify 5 indicators for this evaluation, then perform live performances, using the entropy method to calculate the weight, and comprehensively evaluate each piano music. The scoring results show that the piano music automatically generated in this paper can reach the level of general manual creation, but compared with the works of famous composers, the score gap is large. It shows that the popular songs automatically generated by the neural network model cannot be compared with the classic songs. The music is flexible and changeable. At the same time, I also hope that the majority of music creators can broaden their thinking when creating and compiling pop music, whether starting from their own original music or simple pop music; as long as you work hard, you can make progress.

数据可用性

使用的数据来支持本研究的结果包括在本文中。

的利益冲突

作者宣称没有利益冲突有关的出版。

引用

z . j .吴安排的艺术,南海出版社,北京,2018。
d·j·纳特,“远见脑科学、成瘾、药物项目。”精神药理学杂志》上,19卷,不。4 p。325年,2005年。
视图: 出版商的网站 | 谷歌学术搜索
y, y . t .什洛莫,h . Wang”动态集成管理的中国跨国并购:纵向视图基于学习的角度来看,“15 ITCONC学报》上,第2268 - 2260页,北京,中国,2012。
视图: 谷歌学术搜索
音乐,赫拉克里斯的我可以去距离(钢琴安排)乐谱,虚拟公司,有些孩子,CA,美国,2016年。
d . c .费尔南德斯”操作系统令人精神抖擞verbo: constituicao da legalidade interna乌尔班纳brasileira音乐流行,”Sociologias,14卷,不。31日,第299 - 270页,2012年。
视图: 出版商的网站 | 谷歌学术搜索
y,计算机音乐技术,科学出版社,北京,2018。
d .应付,“音乐智能的计算机建模EMI,”电脑音乐杂志,16卷,不。2、69 - 83年,1992页。
视图: 出版商的网站 | 谷歌学术搜索
m·弗格森”控制,稳定,和等待时间在开槽ALOHA随机访问系统中,“IEEE通信,23卷,不。11日,第1311 - 1306页,1975年。
视图: 出版商的网站 | 谷歌学术搜索
y Visell,“自发组织、模式模型,和音乐,”有组织的声音,9卷,不。2、151 - 165年,2004页。
视图: 出版商的网站 | 谷歌学术搜索
d·j·o·威廉森诊断与人工智能的哲学伦敦国王学院(伦敦大学),伦敦,英国,1998年。
b . j . A . GenJam“遗传算法生成爵士独奏。”CMC卷,94年,第137 - 131页,1994年。
视图: 谷歌学术搜索
,的d·艾克和j·。施密德胡贝尔表示“第一次看作曲递归神经网络,lstm”史装饰板材Molle是的Di某黄化Intelligenza Artificiale,103卷,2002年。
视图: 谷歌学术搜索
j·a·富兰克林“复发性神经网络对音乐计算,”通知杂志上计算,18卷,不。3、321 - 338年,2006页。
视图: 出版商的网站 | 谷歌学术搜索
b·d·史密斯和g·e·加内特,“强化学习和创造性、自动音乐即兴诗人”《国际会议在进化和生物启发的音乐和艺术马拉加,页223 - 234年,西班牙,2012年4月。
视图: 出版商的网站 | 谷歌学术搜索
b·洛根,”梅尔频率cepstral系数对音乐建模”学报第一国际研讨会音乐信息检索美国普利茅斯,马,2000年10月。
视图: 谷歌学术搜索
t·h·朴数字信号处理的音乐,上海音乐出版社,上海,中国,2018。
l . m . Surhone m . t . Tennoe, s . f . Henssonow窗口函数、鼠尾草、纽卡斯尔、英国,2013年。
a . l . t . Biegler韦希特尔和“内点过滤线搜索算法的实现大规模非线性规划,“数学规划,卷106,不。1,25-57,2006页。
视图: 出版商的网站 | 谷歌学术搜索
z . c .立顿、j·伯科威茨和c·埃尔坎”的复发性神经网络评论序列学习,”2015年,https://arxiv.org/abs/1506.00019。
视图: 谷歌学术搜索
g·布沙尔”聚类和分类采用softmax函数包括高效的界限,”软计算,15卷,不。8,289 - 299年,2011页。
视图: 谷歌学术搜索
a·杰弗里·j . Rathke和j . r . Java,完全抽象的跟踪核心Java语言的语义施普林格,柏林,海德堡,2005。
d·e·布斯“熵方法”,技术计量学,50卷,不。1,p。92年,2004。
视图: 谷歌学术搜索

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

866年

下载

456年

引用