文摘

音乐与人的追求艺术,大量的歌手开始分析音乐在未来的趋势和创作音乐作品。首先,本研究介绍了音乐理论流行趋势分析,大数据挖掘技术和相关算法。然后,自回归综合移动(ARIM),随机森林,和长期和短期记忆(LSTM)算法用于建立图像分析和预测模型,分析音乐数据,并预测音乐的趋势。这三个模型的测试结果表明,当歌手的歌曲从三个方面进行了分析:收集、下载和播放时间,LSTM模型可以预测的播放时间。然而,LSTM模型也有一些缺陷。例如,模型无法准确预测一些歌曲与大数据波动。同时,没有大数据回放时间差距ARIM模型预测的图像分析和实际播放时间,显示容许误差波动范围。综合分析表明,与ARIM算法和随机森林算法相比,LSTM算法能更准确地预测音乐的趋势。研究结果将有助于许多歌手创作歌曲根据当前和未来的趋势和音乐也会使传统音乐创造更多的信息化和现代化。

1。介绍

流行音乐作为娱乐产品,吸引了更多的关注。根据相关研究,中国移动音乐市场发展迅速,从2013年到2018年。此外,许多类型的流行音乐的发展决定了音乐在未来的主要发展方向在一定程度上(1]。它反映了许多社会行为对流行音乐的影响和观众的偏好相关的音乐2,3]。使用图像分析和预测发展趋势的流行音乐,音乐库资源的集合,用户行为在不同的平台上的集成,我们可以分析用户数据和喜好,提供各种流行音乐数据集,准确地分析音乐作品的特定属性,准确控制动态流行音乐。用户首选项的趋势决定了流行音乐的形式(4]。几乎没有研究图像的预测流行音乐在世界各地的趋势。2016年阿里巴巴集团阿里巴巴推出音乐趋势预测。经过近7年的发展,阿里巴巴音乐有近100万用户行为分析和历史记录数据。之后,艺术家或歌曲的数量在下一步和未来的黑马将被排除在主流数据。多种音乐平台将主要控制流行音乐的趋势(5]。

数据挖掘是一种新的学科在1980年代出生的。它主要面向人工智能研究领域的业务应用程序。从技术的角度,数据挖掘是一个获取隐含的过程,未被发现,和潜在的有价值的信息和知识从大量复杂的、不规则、随机和模糊数据。数据挖掘是提取、转换和分析一些潜在的法律和价值观从一个巨大的数据库获取关键信息和有用的知识,协助业务决策。今天,90%以上的互联网上的数据生成的两年之内,,每天产生的数据量以极大的缓解仍在上升。在这个背景下,是不够有能力独自接收和存储大量的数据。还需要处理这些数据有效地获取法律和模式能够指导未来的行为,提高企业的效率,社会效果,组织和机构的效率。计算机处理的速度非常快,但是,从大规模数据挖掘和储蓄广播的律法不是一个简单的操作。因此,需要有一个好的数据挖掘算法来完成“黄金在沙子上的过程。“因此,各种数据挖掘算法和储蓄。

当前研究的目的是使用LSTM预测音乐趋势(长期和短期记忆)算法和大数据技术的图像,和他们帮助歌手创造歌曲根据流行音乐的当前和未来的趋势。本研究的创新是选择最合适的和准确的算法模型的比较分析ARIM算法,随机森林算法,LSTM算法。结果表明,与传统的图像预测模型相比,LSTM算法有更好的预测精度。

在当前大数据的时代,各个行业试图摆脱传统的开发模式,利用数据。音乐产业已经逐渐引起了众多学者的兴趣研究大数据的应用程序。

王等人提出了一个CL-LDA(潜在狄利克雷分配)主题模型,该模型可以很好地适应主题挖掘的任务与稀疏短语义和缺乏信息共存ohc(在线健康社区)[6]。Herve等人发现,提取的语义记忆和情景记忆是不同的神经网络完成的。然而,这些结果基本上是获得使用语言和视觉空间的材料。他们试图利用常见或罕见的旋律探索语义下的神经基质和情景的音乐元素7]。金等人设计了一个智能神经网络自动创建特定类型的音乐作曲。模型有一个优越的和创新的结构,获得音乐序列使用演员的短期记忆。然后,它决定通过一个过程序列的概率通过奖励反馈提高音乐创作的性能。除此之外,音乐的规则理论引入限制类型的生成音乐(8]。Pelchat和Gelowitz输入图像的谱图产生的时间片的歌曲到神经网络分类成各自的音乐风格的歌曲(9]。燕T-S-based认知训练网络权值的神经网络和改进的遗传算法。他们动量的综合集成方法和学习rate-adaptive调整隶属函数的参数调整策略。除此之外,他们引入了修正系数与输入维度隶属度。极端输入维度灾难导致规则,表明他们的研究方法是适合的音乐识别系统(10]。孟和陈选择两种方法不同于以前的梅尔·Cepstral系数和常数变换提取特征的音乐,他们卷积神经网络用于训练和识别。他们采用了梅尔cepstral系数来决定音色和使用常数变换来确定。他们最终发现,识别成功率达到95%后,输入相应的特性的神经网络训练和学习11]。张等人提出了一种改进的基于歧视音乐分离方法训练神经网络,提出了一种改进的目标函数深度歧视培训。此外,他们把一个额外的层添加到款模型并介绍了时频掩蔽优化估计伴奏的歌。他们使用傅里叶反变换得到相应的时域信号。最后,他们验证了不同参数对分离性能的影响,并与现有的音乐分离方法。实验结果表明,改进的目标函数,引入时频掩蔽的分离性能显著提高,款和分离性能与其他现有的音乐相比提高了大约4 dB分离方法(12]。道森等人指出,人们可以训练网络解决音乐问题和研究这些网络编码音乐属性。他们还报道非常高的相关性之间的网络连接权重和离散傅里叶相位空间用于表示音乐集(13]。Dorfler等人提出的问题是否取代它直接通过应用自适应或学习过滤器原始数据可以提高学习的成功。理论结果表明,大约繁殖mel-spectrogram系数通过应用自适应滤波器和随后的时间平均振幅平方原则上是可能的。他们还进行了大量的实验工作在音乐唱歌声音检测的任务。分类的实验结果表明,基于卷积神经网络、自适应滤波器的特性获得银行紧随其后的是时间平均平方系数滤波器的输出执行比规范化傅里叶transform-based mel-spectrogram系数。他们相信另一种自适应方法与中心频率或时间平均长度从训练数据做得都很好(14]。刘等人利用底层的声音(音频信息和开发了一个新的CNN架构,考虑的多尺度时频信息。CNN架构转移到更合适的语义特征的决策层歧视类型未知的音乐片段。他们在基准数据集进行实验,包括GTZAN、舞厅、舞厅和扩展,这证明了性能优良的体系结构15]。周建立了区域文化和音乐特色资源数据库的数据挖掘技术和分类区域特点的音乐和文化资源数据结合改进的BP(反向传播)神经网络模型。他们还构造一组数据库包括分类、搜索、试镜,和存储保护和传播地区音乐文化资源特征。同时,它也为文化遗产提供了新思路16]。

上述研究领域的大数据和不同的神经网络音乐促进了这些技术的成熟度。有一些音乐的准确性的差异由不同类型的神经网络建立预测模型和算法应用于音乐领域。因此,选择不同的算法建立模型来预测趋势的音乐更准确。

3所示。构建预测模型和方案设计

3.1。分析音乐的趋势

一群人在社会,由特定的心理需求,进行特定的音乐行为在一定时期内,导致某些音乐流派在一定的社会背景中传播。这种社会现象可能形成不同程度的社会普及和社会狂热,这可以称为音乐推广。这里的音乐趋势是限于一个歌手在未来的具体分配点。

当前的音乐分析和研究的基础主要是在用户的建议。很少有研究领域的流行音乐教学,包括神经网络、高斯混合模型和支持向量机。音乐结束的常用预测方法预测包含SVM(支持向量机)和ANN(人工神经网络)。这些模型通常有一个有限的学习能力和较低的高维核函数解释能力。特别是,径向基函数对缺失的数据很敏感的17),这不是一个好的选择处理在线音乐的质量数据。利用人工神经网络建立一个音乐趋势预测模型需要一个大实验环境,很长一段时间中预测效果。此外,人工神经网络需要的各种参数对实验结果有很大的影响,使复杂的工作负载(18]。网络音乐数据是多样的、复杂的、高维度,和相当大的。现有的音乐视频模型和传统的统计模型通常很难实现有效的数据分析的在线歌曲(下载,玩计数,和集合)。此外,音乐家在与观众有很多困难。深入挖掘音乐数据的结果也不理想。近年来,许多预测模型的角度研究了回归预测和时间序列。他们取得了预测结果具有相对较高的精度基于随机森林算法在很多领域。因此,根据回归预测方法,ARIM算法,随机森林算法,LSTM算法建立预测模型选择的音乐趋势从时间序列的角度预测。

3.2。大数据挖掘

1显示了CRISP-DM(跨行业标准数据挖掘过程参考模型。在数据挖掘的过程中,有两个重要的链接,即模型评价和模型建立,这两个属于机器学习。

机器学习是一个过程的计算机模拟人类学习行为。两个基础数据挖掘,机器学习提供了技术方法分析数据,和数据库技术实现数据挖掘的数据管理。图2代表的关系数据库技术、数据挖掘和机器学习(19]。有三个主要类型的机器学习:semisupervised学习、无监督学习和监督学习。

监督学习涉及一组带安全标签的数据时,使电脑能够使用特定模式识别的新样品每个标记类型。两个主要类型的监督学习分类和回归。代表的监督学习方法包括决策树、朴素贝叶斯模型和支持向量机。在无监督学习中,数据是labelless像大多数现实世界中的数据。因此,非监督学习算法(尤其有用20.]。无监督学习方法分为两类:(1)一个是直接基于概率密度函数估计方法:试图找到特征空间中的分布参数和分类。(2)另一个是简洁的聚类方法基于样本之间的相似度测量:其原理是设法确定不同类别的核心或最初的核心,将样品聚合成不同类别根据样本之间的相似性度量和核心。使用聚类结果,我们可以提取隐藏信息的数据集,未来数据进行分类和预测未来数据。它应用于数据挖掘、模式识别、图像处理、等聚类主要用于分类数据根据其行为或属性,而降维的变量可以减少数据集。无监督学习的最具代表性的是k - means方法。semisupervised学习分类数据的角色有或没有标签使用分类函数。最具代表性的算法semisupervised学习期望最大化算法(21]。

3.3。回归分析模型
3.3.1。随机森林算法

随机森林是指使用多个树的分类器训练和预测样本。随机森林是一个算法,集成了多个树使用整体学习的想法。它的基本单位是决策树,其本质属于learning-ensemble机器学习方法的一个主要分支。有两个关键字的名义随机森林,一个是,另一个是“随机森林。“机器学习通常可以分为以下类别:降维,集群、回归,和分类。回归不仅是一种监督学习技术也相对全面的技术。回归的主要作用是预测目标,如未来天气,未来的股票市场,或商品的价格。与其他方法相比,回归预测方法的精度最高。因此,许多研究使用回归模型来预测和分析相关问题。首先应该选择最合适的方法建立回归模型的过程。 For example, the least square method is suitable when the dimension of the surveyed data is relatively small [22]。回归模型广泛应用于广泛的预测领域,如股票趋势,经济趋势,未来的产品销售,和事件风险预测。此外,协作随机森林算法也可以有很好的预测效果和广泛的适用性。随机森林算法本质上是一种监督学习算法,这是一个完整的决策树学习算法。随机森林算法不仅可以应用的分类问题,也回归模型(23]。

3.3.2。决策树算法

决策树是一个树状结构,其中每个内部节点表示在一个属性上测试,每个分支代表一个测试输出,而每个叶节点代表一个类别。分类树(决策树)是一个非常常见的分类方法。它是一种监督学习。所谓的监督学习是给一堆样品,每个样品都有一组属性和类别。这些类别是事先决定的,然后,一个分类器可以通过学习获得,可以给新对象正确分类。图3显示了决策树,圆圈代表根节点和内部节点,和广场代表着叶子节点。

必须遵循三个步骤的过程中建立一个决策树。首先,选择目标对象的特性。其次,建立树的增长趋势。第三,修剪树木。到目前为止,决策树算法已广泛应用于股票预测,商品价格预测,房价预测,预测未来的经济趋势。它在许多领域取得了卓越的成就。

(1)熵,熵的本质是解释随机变量的不确定性。让X是一个随机变量和的值X是一个范围的X1,X2、…XnX可以代表值,随机变量的概率X=X是设置为P。然后,设置随机变量的熵X作为H(X),可以写成

D随机变量的样本集。X代表的具体类别D。有总K类别中选择样本D。与此同时,|CK|表示类别的样本的数量K、|D|是样品的总数。然后,每个类别的概率是慢性肾病和样本集的熵D表示为

(2)信息增益:熵的信息增益值的区别是之前和之后的数据集是除以一个特性。熵的本质是随机变量的不确定性。当熵值的增加,样本中变量的不确定性也将增加。因此,熵的值之前和之后的差异划分可以用来判断样本集的划分效果D在当前的特性。样本集的熵D部门之前是肯定的。获得的信息 (D,一个)等于熵之间的区别H(D数据集的划分之前)D由一个功能一个和熵H(D)D。的计算 (D,一个)所示

(3)信息增益率:信息增益率是一个点球的产品参数P和信息增益的本质。惩罚参数是熵的倒数H一个(D)的数据集D与特性一个作为一个随机变量;即样本具有相同功能的价值一个分为相同的子集。一般来说,惩罚参数成反比的数量特征。

惩罚参数可以计算如下:

方程(5)是信息增益率的计算方法: 在上面的方程中,H一个(D)是通过当前获得的熵特性一个的随机变量样本集D (D,一个)代表信息增益。

3.3.3。线性回归算法

假设有一个数据集和替代一些特性X1,X2、…XP预测对象变量Y。在一个相对简单的模型中,假设对象变量Y这些特性的线性组合:

3.4。时间序列模型
3.4.1。LSTM模型

LSTM是一种特殊的RNN(递归神经网络)结构改进的基于RNN [24]。LSTM本身是一个整个神经网络的一部分,而不是一个独立的网络结构,取代原网络的隐层单元。LSTM可以处理数据与时间序列数据等“序列”的特性,如每天的股票价格趋势和机械振动信号的时域波形。此外,它可以处理数据的数据使用序列属性组成的自然语言命令字(25]。

所有RNNs链有重复神经网络模块。RNN的标准,这个重复的结构模块只有一个非常简单的结构,例如双曲正切层。LSTM也是这样一个结构,但重复的模块有不同的结构。不同于单个神经网络的结构层,LSTM有四个交互层,在一个非常特殊的方式进行交互。LSTM是深度学习的人工RNN架构(26]。

LSTM不仅可以处理单个数据点(如图像),还处理整个数据序列。LSTM单元包含内存单元,输入,输出,和忘记门。内存单元可以记住任何时间间隔内的值,和三个盖茨控制信息流动进入或现有的单位。LSTM尤其适用于分类、处理和预测的时间序列数据,因为可能会有滞后之间的未知的时间重要事件在一个时间序列。LSTM开发应对可能发生的爆炸和失踪梯度问题传统RNNs训练。缺口长度的相对不敏感的优点LSTM RNN,隐马尔科夫模型,和其他顺序学习方法在许多应用程序中。

LSTM的第一步是决定抛弃什么信息从细胞状态,这是完成使用忘记门。输入通道的作用是将新数据添加到细胞的状态。输出门的作用是确定的值输出。Xt代表输入,年代t−1表示状态的单元内存和ht−1——忘记门的中间输出。保留向量更新状态记忆单元共同决定的Xt乙状结肠函数和双曲正切函数的作用下。此外,年代t代表内存单元的状态被更新后,ot代表输出门的状态,ht指的是中间输出。然后,方程(7)- (12)得到:

在上面的方程中,ft是忘记门的状态,而t代表输入门的状态, 表示输入节点。除此之外,ot指的是输出门的状态,年代t是内存单元和ht代表中间输出的状态。 忘记门的权重矩阵,输入,输入节点,输入和输出门乘xt,分别。与此同时, 表示忘记门,虽然 代表输入门, 是输入节点。除此之外, 代表的重量后的矩阵乘法的中间输出ht−1和输出门。此外,bf,b, ,bo忘记门偏差项目,输入通道,输入节点,分别和输出门。与此同时,⊙表示向量中每个元素的乘法,σ表示乙状结肠的变化函数,Φ代表双曲正切函数的变化。

3.4.2。ARIMA(自回归综合移动平均)模型和ARMA模型(自回归和移动平均)

时间序列研究的过程中,ARIMA模型ARMA模型的优化(27- - - - - -29日]。两种模型适合处理时间序列数据。ARIMA模型可以实现数据的准确预测。当获得数据特性不是很稳定,ARIMA模型可以用于稳定数据特性使用初始差分法(30.- - - - - -32]。

3.5。数据分析功能

(1)分布分析:首先,确保数据质量的前提下,工具,如绘图软件、编程软件、建模软件和分析软件,用于可视化歌曲数据进一步观察数据的分布。数据的特定类型和特征可以通过数据分布的分析。如果获得的数据是定量数据,然后建立了分布直方图和频率分布表数据的视觉呈现。否则,条形图、饼图和折线图绘制,实现定性数据的可视化。(2)比较分析:比较分析了有关指标数据量的角度评估算法的预测精度。比较分析也可以进行数据分布,通常用于时间序列的比较分析和不同指标之间的横向或纵向的比较。例如,使用横向和纵向的比较分析三个方面的统计,收集,和下载的歌曲,歌手可以分为两种类型:爆炸歌手和稳定的歌手。(3)统计分析:这种方法主要分析数据分布,如分布形状分析、离散程度检测和浓度分析。描述数据的基本统计信息也分为三类:形状分布统计,色散统计,和集中趋势的统计数据。数据的统计和分析图表的形式给出了每首歌的进一步研究规则和数据分布趋势。以下三个统计数据是用于识别和分析数据:收集、下载和播放计数。

4所示。数据处理和预测分析

4.1。LSTM模型的预测结果

4说明了统计数据的收集,统计,和下载不同类型的歌手。

LSTM模型是用来比较的实际和预测价值三个歌手来自中国大陆,香港,和另一个国家,如图5

在的真实值和预测值的比较三个歌手来自不同地方,歌手来自中国大陆的预测误差相对较大。然而,其他两个歌手的预测基本上是接近实际值。总的来说,与此同时,预测数据波动剧烈,但它最终将稳定和接近真正的价值。图6介绍了收集的统计数据、下载和播放数九歌,包括三个中文歌曲,三个粤语歌曲,和三个英文歌曲。图7显示了预测价值和实际价值的九歌的计数。

九歌的预测从收集、下载和播放,播放数的预测模型取得了良好的九歌。然而,该模型无法准确预测和广泛波动玩计数的歌曲。其他方面的预测结果基本接近实际情况。因此,音乐的预测时间序列趋势的LSTM算法显示了良好的效果。

4.2。ARIMA模型的预测结果

8代表玩数的比较两个不同的歌手的歌曲。

根据图8《每日玩数这两个歌手的歌曲是接近于平稳时间序列。因此,一阶差分操作是在数据上执行的计算使原始时间序列数据大波动变得相对稳定的时间序列数据。图9说明了歌曲的播放数的预测在未来两个月从用户的角度和歌手。

9表明没有明显差距播放歌曲的数的预测值和实际值,以及预测的误差波动值在允许范围内。因此,ARIMA模型可以准确预测数的歌曲。

4.3。比较不同模型的预测结果

在实验中,rim的模型预测算法,随机森林算法,LSTM算法进行了比较。图10说明了美(平均绝对误差)和RMSE(均方根误差)的预测结果。从2020年10月1日,10月31日,2020年,九歌的测试预计播放时间使用ARIM算法,随机森林算法,LSTM算法。

根据图10,LSTM算法具有更好的预测性能的歌曲数的9个艺术家ARIM算法和随机森林算法。除此之外,与其他两种算法相比,RMSE和梅LSTM算法减少了数据从0.072和0.045到0.045和0.032,分别。与此同时,错误率降低了36.5%和28.1%,相比之下,ARIM算法和随机森林算法。因此,LSTM算法能更准确地预测音乐的趋势。

5。结论

音乐的预测趋势主要是通过LSTM和大数据挖掘。建立的预测模型是ARIM算法,随机森林算法,LSTM算法来预测歌曲的数据和计算时间序列的波动。分析后的结果表明,9个歌手的收集、下载和播放计数,LSTM模型做了很好的预测数的9个歌手的歌曲。然而,也有一些缺陷在LSTM模型。例如,一些歌曲的模型无法准确预测大型数据波动。其他方面的预测结果接近实际情况。

与此同时,在剧中没有大错误计数ARIM算法的预测结果和实际值,误差波动的预测也是在允许范围内。这表明ARIM算法还可以满足预测分析。综合分析后,LSTM算法具有音乐的最精确的预测趋势三个算法。然而,在这项研究中仍存在一些缺陷。歌曲通常有相对较高的周期性和随机性,很大程度上受外部因素的影响,有可能是一些影视作品的出现会导致显著增加音乐的播放数。因此,这些方面的可行性误差分析应该在未来的研究。

数据可用性

使用的数据来支持本研究的发现可以要求作者。

的利益冲突

作者宣称没有利益冲突。

确认

这项工作是支持的音乐学院山西大学。