文摘
近年来,随着经济水平的提高,音乐艺术已经成为一个主要的课外教学的焦点。包括各个年龄段的学生。然而,钢琴教学的高成本和独特的教师和学生一对一的教学方法导致钢琴教育资源的缺乏。学习钢琴已经成为奢侈品的活动。因此,利用计算机多媒体软件教钢琴已成为一个可行的方法,以缓解当前的矛盾。钢琴教学,主要困难是教师和学生之间的差异(即。,the data change at both ends due to the network), the instability of the network system, and the neural network algorithm can solve these difficulties. Based on this point, this work aims to introduce neural network algorithm into piano teaching intelligent system. This paper first introduces the theoretical basis of the neural network algorithm, then expounds the algorithm flow and general framework of the algorithm in speech recognition, and explains the split explanation in combination with five aspects: preprocessing, character extraction, acoustic model, linguistic model, and decoding. Then, it introduces the system design of intelligent piano teaching and describes the general system requirements and product architecture. Finally, the intelligent piano teaching system is tested and applied to prove the effectiveness of the system. I hope this intelligent piano teaching system can provide more convenience for piano teaching.
1。介绍
目前,由于经济持续发展,人民生活水平提高。除了满足最基本的需求的服装,食品,住房,交通,人们正在寻找更高层次的精神需求。因此,人们越来越热衷于学习钢琴,钢琴教学市场也在增长。近年来,想学钢琴的人的数量已经急剧增加(1,2]。所有年龄段的人都有钢琴爱好者,幼儿学习钢琴的数量是最大的。城市中产阶级以上的家庭中,有五分之一的家庭有父母希望自己的孩子学习钢琴,钢琴等级考试和申请的人数也在以每年20%的速度增加(3]。此外,由于实现国家教育体制改革和教育规模的不断扩大,对钢琴教师在教育系统的需求也增加4]。在这个行业,具备专业知识和教学资格的人才已经成为稀缺资源,而这个现象在短期内不能有效地解决了由于各种原因(5]。基于这一点,本文在信息技术领域,并试图引入神经网络算法来模拟钢琴教师的教学行为。随着人工智能研究几十年的历史,在许多方面它开发了更成熟和有能力开展研究工作6]。摘要神经网络算法技术与钢琴教学智能系统,神经网络数学模型应用于钢琴表演教学体系的建设。因此,首先,神经网络的原理,BP神经网络的建设,基于BP神经网络的系统设计原则,和钢琴练习语音识别技术,分别。其次,介绍了系统需求分析和系统设计结构,包括使用钢琴智能教学的过程。最后,仿真系统测试执行。根据测试结果,用户体验设计的智能教学系统的研究包括六个维度:美学、学习、效率、可靠性、吸引力和满意度。然后,选择智能钢琴教学系统为研究对象,进行问卷调查是教师和学生,最后回收问卷。经过分析,结论是,系统取得了良好的积极的评价。希望这样一个聪明的钢琴教学系统,它不需要特殊的硬件,涵盖范围广泛的音乐资源,易于使用,并且可以密切结合线下教学场景,可以帮助钢琴爱好者投资学习过程。
2。相关工作
objective - c语言是用于文档的开发客户。后端系统的主要支持客户,微信,网页和提供restful API接口。客户端可以检测和评估学生的表现根据现有的多频声检测算法的研究小组7]。客户第一次提供了任务让学生完成他们的作业,给老师演示。微信终端主要提供学生作业管理,用户信息管理,用户的社交网络和其他功能(8]。文献描述了需求分析、设计、实现,和测试辅助的钢琴练习系统。系统将提供更多的便利和更好的对传统钢琴教学的教学效果,帮助学生学习钢琴,并为家长和老师提供方便的学习管理工具(9]。目前,系统已经上线。1256年它包含26日书,电子音乐资源,6713注册数据和752的注册用户。该系统是深受用户好评。同时,系统通过用户的反馈,不断提高(10]。本文提出一种智能个性化的教学体系。外观改变了传统信息化教育模式,为学生提供了现代教育模式11]。此外,它已经从一个静态piano-assisted教学方法的新系统教育理论与动态钢琴课程策略(12]。文献探讨了钢琴教学软件的实现方法,提出了一种新的方法来确定钢琴表演相结合(即神经网络模型。、计算机教学是单向的,只有知识的转移,没有互动链接)模仿教师和学生开展教学活动13]。文献建立神经网络的数学模型,完成输入和输出参数的确定和量化,然后收集相关数据训练网络(14]。输入是评估通过音乐表现,也就是说,弹奏乐器的性能。当前研究活动的很大一部分集中在这些音乐的计算机的计算功能,并已经有了一些研究成果。
3所示。神经网络算法的理论基础
3.1。神经网络原理和BP神经网络的建设
神经解剖学和神经细胞学显示人类思维大脑中完成。人类大脑的基本单元是神经元。人工神经网络(ann)是接收和处理信息的互联神经网络。用数学和物理方法,人类大脑的神经网络可以简化,抽象,和模拟从信息处理的角度,以打开一个新方法来解决问题的不确定性和非线性复杂性。BP(反向传播)神经网络是使用最广泛和深入研究了目前人工神经网络。
一个人工神经网络捕获和处理信息的神经元和模拟生物神经元的结构和功能。人工神经细胞传递信息的过程如图1。
神经元有多个输入信号xio。是连接的重量,橙汁神经元的输出,f是一个特定的传递函数关系,称为激励函数或操作函数,这通常是一种非线性函数关系,θ神经元的阈值,输出神经元j可以表示为
顺序如下:
然后,
输出每个神经元的“0”或“1”表示“抑制”或“激励”状态,分别;然后,
3.2。基于BP神经网络的系统设计原理
BP神经网络的基本思想是正向和反向传输的信号。直接传导传播从输入层到输出层。如果传导的结果不一致,传导驱动将被执行。误差通过逆向传导转移到输入层到隐层的一种特殊的方式。即使重量校正,误差抑制在各方面来捕捉每一层的误差信号。过程本身的重量不断调整和反复迭代。在这两种情况下,大部分的神经网络的训练过程可以完成,和学习时间都在预定义的设定范围。
常用的传输函数的BP神经网络是单极对数团体功能,双tansig函数(或双曲正切函数),和purelin线性函数。log-sig函数的表达式
双相情感的表达乙状结肠函数(或双曲正切函数)
purelin线性函数表示为
连接的重量并与输入层Ѳ阈值j计算输入年代j每个神经元的隐藏层,然后使用年代j通过激活功能:
计算输出bj隐层中的每个神经元: 其中
计算输入lt(激活值)的每个单元的输出层输出,连接权重和阈值的中间层,然后,计算响应ct每个单元的输出层的激活函数: 其中
使用预期的输出模式,网络实际输出ct计算修正错误每个单元的输出层:
使用 , ,bj计算修正错误ekj:
与 ,bj, ,和Υt之间的新连接的重量,计算下一个过渡层和输出层: 在哪里N是学习时间。
通过ekj,阿基, ,和Ѳj,计算新连接下一个输入层和中间层之间的重量:
BP网络的学习过程如图2。
3.3。语音识别技术的钢琴练习
算法的结构和语言识别的过程包括五个方面:预处理、特征提取、声学模型,语言模型,和解码搜索,下面将描述一个接一个。
3.3.1。预处理
语音信号的预处理过程主要包括端点检测和降噪。
端点分析旨在保护有效语音的语音流的一部分,消除无效的沉默的一部分,包括前端和后端识别有效的演讲。样品的一次演讲中,沉默的词性的振幅很小,也就是说,信号强度很小,而实际的词性的振幅大,信号强度很大。在时间方面,原始语音信号是一个连续函数。取样后,它变成了一个离散的序列,可以由计算机处理。语音信号的平方,然后综合和总结得到信号在连续时间间隔(一个,b),或总能量N采样点的采样点n,
根据语音信号分为一组时间得到语音信号的每个部分。这些特性被称为帧。有n采样点在一个框架和一个帧信号的能量价值可以从(20.)。通过改变每一帧的能量价值,如果能量连续帧的价值一个0点之前低于默认的标准E0,连续的能源价值框架一个0是高于阈值e,它被称为前端点;如果一个框架点的能量值一个0是高于预设阈值E0,和随后的连续帧的能量值一个0是低于阈值e,它被称为端点。
3.3.2。特征提取
语音时域信号波形的采样点,这通常不是直接用于识别,因为很难找到时间信号的发音规则。即使发音相似,它在时域可能差别很大。因此,声谱短时傅里叶变换得到。然后,根据听觉感知机制,每个组件的振幅谱的声音段调整单元的框架,这样它就可以被参数化来获得正确的语音信号的特征向量,表示为声学特征。
本文使用最广泛和有效的梅尔频率倒谱系数(MFCCs)作为声学特征参数,它们倒频谱参数来自梅尔频率范围。梅尔频率定义了人耳频率的非线性特点,及其与线性频率的关系如下公式所示:
3.3.3。预加重
这一步的目的是改善信号的高频部分和压平信号频谱,以确保整个频段的低频,高频部分可以得到一个统一的信噪比。预加重的原则是让信号通过高通滤波器,和它的响应函数如下公式所示: 的价值在0.9和1.0之间,0.97是在这里拍摄的。
3.3.4。窗口
每一帧信号的陷害乘以汉明窗增加左和右的连续性框架,在窗口函数是由以下公式表示:
N是当前帧大小,不同的价值观所产生的汉明窗没有方向性。0.46本文。
3.3.5。梅尔·过滤
通过能谱通过一组三角形滤波器在梅尔,假设过滤器过滤器银行的数量米(本文是24),滤波器的中心频率f(米),米= 1,2,…米。三角形滤波器的频率响应以下公式:
3.3.6。对数运算
执行对数操作的输出能量,如以下公式所示:
3.3.7。离散余弦变换
MFCC系数是通过离散余弦变换,如以下公式所示: 在哪里lMFCC系数的顺序,米是三角形的数量过滤器,和微分的计算参数如下公式所示: 在哪里dt表示顺序的差异t,Ct代表了倒频谱系数,t代表的顺序倒频谱系数,K表示一阶导数的时差。二阶变量参数可以获得。
3.3.8。声学模型
声学模型计算的功能 ,代表被公认为语音信号的概率在文本序列(在哪里X代表特征从演讲中提取帧,表示文本序列)。声学模型之间的映射关系是演讲和声学模型的基本单位。你可以选择不同的基本声学单元创建一个声学模型。英语通常使用音素建模,而中国可以使用音素、音节或单词建模。对于大型识别单词,音素通常用作基本模型。
3.3.9。语言模型
声学模型的目的是将语音的声学特征映射到音素和单词的基本单位,而语言模型的目的是将音素或词序列解码成完整的句子。例如,Yuanli解码的声学模型,但是有多个相同的结果,如原则和距离。语言模型预测的任务是找到最合适的结果从这些可能的结果。语言模型是指词的概率事件序列。假设一个句子组成 ,生成序列的概率由以下公式表示:
3.3.10。解码搜索
解码的目的是找到最可能的短语输入语音信号后参与根据声学和语言模式。大量训练有素的声学模型和语言模型,分别,然后,这两个分数相结合寻找最好的候选人,最后,语言识别的结果得到如下公式所示:
4所示。钢琴智能教学系统的设计
4.1。系统需求分析
在线教育产品,系统的总体需求分析从主题是分不开的,即学生。本文的智能钢琴教学系统是针对学生,需要家长的参与来实现更好的教学效果。同时,通过研究离线钢琴教育市场,我们发现所有的学生在钢琴学习的学校,和钢琴学校任命教师训练学生。因此,我们还需要组织教师通过校长。简而言之,有五个类型的智能钢琴教学系统的用户:系统管理员、家长、学生、教师、和主体。系统管理员负责上传和管理评分,观察和分析性能数据,分析用户行为。父母是负责提供和监督作业和管理学生信息。学生必须审核报告并完成任务。教师负责监督学生和分配作业。主要负责教师发展。 Based on the above analysis, the overall requirements diagram of the system can be fundamentally determined, as shown in Figure3。
4.2。系统架构设计
智能教学系统是一个重要的CAI的发展方向。这意味着开发人员正在使用人工智能技术使计算机扮演教师的角色个性化教学和对学生实施个性化教学模式。学生不同的学习特点和能力应该采取不同的学习策略进行自适应教学在未来学习方向的学生,从而达到真正意义上的个性化教学的目的。一般来说,智能教学系统的逻辑结构大致分为三个模块结构和四个模块结构。然而,随着科学技术的进步和新技术的出现,智能教学系统的逻辑结构也受到影响,导致相应的变化。
一般来说,智能教学系统的基本逻辑架构通常是由三个基本模块:学生模块、教师模块、知识库,如图4。
4.2.1。准备学生模块
该模块负责记录学生的个人信息、课程和考试的问题。教师能掌握学生的基本信息、学习能力和认知能力通过这个模块。还分析了学生的当前信息数据正确判断学生的理解的知识和采用合适的个性化教学的教学方法。
4.2.2。教师模块
通过这个模块,教师可以了解学生的不同信息,选择教学内容,学生需要学习,并将其呈现给学生,学生将接受,这样学生就可以获得优秀指导教师和研究教学策略适合学生。通过本系统,教师可以掌握学生的基本信息、学习能力、知识掌握,考试成绩,然后制订相应的教学安排。
4.2.3。专家知识模块
知识库,用于存储所有教学知识,促进学生的学习和学习为学生提供了他们想要的知识。知识库的特点是现成的和适用的,这是在专业领域需要解决的问题。所有教学知识的存储、组织和管理在计算机内存存储在知识库的形式,可以用于其他模块。数据库服务器主要用于存储各种教学资源,如学生和教师个人模型信息基础,专业知识基础,模型教学知识库,和学习/测试历史数据库,如图5。
4.3。系统使用过程
UT(用户界面)的设计对软件质量的一个非常重要的影响。涉及的知识有很多,但总的原则是让用户花更少的时间和步骤操作,完成尽可能多的任务。所需的最低时间指的是用户熟悉的界面。
学习音乐理论知识是通过结合文本、图片、声音、动画等多媒体教学内容。可以实现这两个步骤:一个是知识转移的过程,另一个是知识资质等级认证的过程。音乐理论知识应该首先分类。这些课程可以选择根据不同的特点。例如,根据学习困难,学习订单包括员工、指法、和弦和节奏。与此同时,学生可以选择课程根据不同的安排,选择和弦等课程,安排根据和弦的名字。这样,学生不仅可以学习一步一步也轻松快速地浏览不同的知识要点。
4.3.1。播放音乐
学习这门课程时,学生应该首先了解学习曲目演奏音乐,和学生将会有一个印象:“效果应该实现当玩这首歌”。音乐播放分为两种模式:陪同,无人陪伴。播放音乐时,员工是动态显示。
4.3.2。性能实践
性能实践采用3 d动画模式,这样学生就可以清楚地看到每个键,每个键对应于不同的指法,人员动态地显示在同一时间。
4.3.3。视听的解释
软件可以模仿钢琴老师教学,可以实现通过记录和钢琴老师的视频和音频。
最重要的是在学习钢琴练习。一旦理论知识理解,它不需要被理解的表现过程,以便玩家可以正确和熟练使用钢琴的技巧理论知识所描述的性能。弹钢琴时,首先确定曲目播放,然后练习以下不同的方式。
跟踪确定后,显示得分。表演者将决定的时间和速度性能,然后执行验证的性能。在这个性能,系统将自动识别性能的进展并显示相应的乐谱。
跟踪确定后,分数将会显示,在标准速度。在性能,表演者必须遵循进步乐谱所示。如果票据丢失,成绩进步是显示在黑色,和完整的笔记以红色或绿色突出显示。表演者可以选择是否激活节拍器的性能。
跟踪确定后,乐谱将不会显示出来,和标准速度将用于性能。以动画方式音符,音符的音高描述显示在不同位置通过显示notes提前举行。
不同长度是用来代表指出,持续时间和不同亮度用于表示强度的笔记。如果注意动画落入某个位置,玩家必须注意。玩家可以选择是否激活节拍器在性能。
在实践的三种模式都有自己的特点。第一个是适合学生非常擅长玩,,第二个是适合学生熟悉音乐的分数。第三种是适合初学者。他们有一个直观的理解笔记由钢琴和可以很容易地开始没有任何理论研究。
性能实践完成后,系统将提供整体水平评估和给需要改进的性能数据,包括错误的节奏和音符。
5。测试和钢琴智能教学系统中的应用
5.1。系统测试
深入测试系统性能是系统优化的一个重要组成部分。只有当系统暴露在高负载环境我们能找到一些代码问题,性能瓶颈,建筑设计在低负载条件下不存在的问题。系统的性能测试是由使用wrk性能测试工具。Wrk performance tester是一个高性能压力测试人员创建基于C语言。与ab压力测试仪,wrk支持多线程,层和底层封装epoll i / o模型重用,大大减少了创建多个ab的工具和编程开销。使用wrk工具的基本方法是进入“wrk-t(数量的线程)- c(连接数)- d(测试时间)- h (HTTP请求报头)URL”在命令行上。在这里,线程的数量通常是测试机器的核心数量的两倍。与此同时,我们可以用Lua编写更复杂的测试脚本。
在这里,我们第一次测试系统的可读性。在这一点上,我们选择的接口来获得一个列表的所有分数压力测试。该接口的HTTP方法,它只读取数据库。由于测试机器的CPU核的数量是4,我们使用8线程和测试持续时间30秒。因为wrk使用http / 1.1协议,长连接在默认情况下都是允许的。我们将使用长时间运行和短连接发送请求到服务器测试下进行测试。测试结果如表所示1。
从测试结果可以得出结论,如果打开的连接数量到100 wrk工具,系统的处理能力将达到高峰,平均每秒的请求数将是最高的。如果连接数超过500,系统将打开更多的连接以最快的速度,但平均每秒的请求数将减少,系统的响应时间将增加,但系统仍然是稳定的。虽然提供的服务是,响应速度非常慢,表明系统的稳定性是充分的。同时,如果发出请求的应用程序是一个长连接,系统的处理能力远远高于短连接。这是因为如果应用程序是一个长连接,wrk工具不需要不断建立和断开连接。消除三个TCP握手可以大大减少总体成本的建立一个连接。目前,实际需求之间完整的连接和full-short连接,所以实际系统两者之间的可读性。
这里测试系统的编写能力。乐谱上传选中的加载压力测试。这个接口发布的HTTP方法。在收到音乐XML文件和乐谱图文件,服务器上传两个文件到阿里巴巴云计算操作系统服务器和写数据库。与此同时,你需要写一个Lua脚本测试。长连接系统的编写功能测试如表所示2。
从测试结果可以看出,系统的写作能力比阅读能力低。这是因为MySQL花费的时间比读数据,写入数据和文件从服务器过载Alicloud OSS服务器也很高。在当前业务,系统将得到比postrequests get请求,所以当前写的系统可以支持现有业务能力。
5.2。用户反馈
调查了教师的特点使用钢琴六个维度的智能教学系统的用户体验如表所示3(注:1 =强烈反对,2 =反对,3 =中立,4 =同意,5 =非常同意)。一般来说,教师用户体验的一般特征智能钢琴教学系统的所有维度是高于平均水平。其中,学习的三个维度(平均= 3.89,标准差= 0.61),吸引力(平均= 3.86,标准差= 0.64),和满足(平均= 3.91,标准差= 0.68)有一个更高层次的相对的身份,而美学的三个维度(平均= 3.77,标准差= 0.70)、效率(平均= 3.75,标准差= 0.78),和可靠性(平均= 3.81,标准差= 0.66)较低水平的身份。
学生的特点使用钢琴九个维度的智能教学系统的用户体验如表所示4(注:上表一样)。一般来说,学生使用钢琴智能教学系统通常在每个维度得分高于平均水平。除了学习方面有相对较高的身份(值= 3.64,标准差= 0.78),没有显著差异水平的其他维度的身份。
6。结论
随着互联网的发展,网络教育是现阶段更发达。如今,网络教育本质上是一种基于传统教学视频学习课程,网络教育已经成为了行业的发展趋势。领域的素质教育,尤其是音乐教育的领域,许多企业和机构也开始构建智能在线音乐教育产品,以提高教师的教学效率和影响学生的学习。音乐教育是人类文化遗产的重要组成部分,和钢琴教育是音乐教育的首要任务。收到良好的钢琴教育可以提高人的文化素质,培养一个人的情绪,促进自我发展,提高协调发展的智能。通过深入研究神经网络算法模型,钢琴教学方法,和音乐理论,本文建立了钢琴教学体系的框架基于人工神经网络模型,完成系统的建设,并进行测试,以验证其可靠性,希望提供帮助那些想要学习钢琴。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称没有利益冲突。