文摘

所涉及的挑战传统的云计算模式的发展促使下一代云计算架构。新的云计算架构可以生成和处理大量的数据,这是不可能的帮助来处理传统的架构。深入学习算法有能力处理这些大量的数据,因此,现在可以解决下一代计算算法的问题。因此,这些天,深度学习已成为最先进的方法解决各种任务,最重要的是领域的认可。在这个工作中,提出了识别城市的名字。识别手写的城市的名字是一个潜在的研究领域的应用领域使用segmentation-free邮政自动化识别方法(整体的方法)。这提出的工作介绍卷积神经网络(CNN)的作用,这是深度学习技术的方法之一。提出了CNN模型训练、验证和分析了使用亚当和随机梯度下降法(SGD)批大小的优化器2,4,8和学习速率(LR)为0.001,0.01和0.1。模型训练和验证在10个不同的类的手写的城市名字果鲁穆奇语编写的脚本,在每个类有400个样本。我们的分析表明,CNN模型,优化器使用一个亚当,批量大小的LR的0.001,取得最好的平均99.13验证的准确性。

1。介绍

云计算是配备良好的解决方案以满足数据存储需求的增加。它为用户提供了各种福利,从而减少的努力在一个高效和有效的方式管理数据。云主要依赖于数据中心,数据中心,位于远离用户,进一步构建数据中心网络连接在一起。所以,下一代云计算架构已经可以处理数据更接近用户,而不是在数据中心处理它。这些新兴模式的云计算生成大量的数据。但是有可能这庞大的数据可能不是分析发现新信息(1]。可以应用各种算法分析的数据。传统算法的性能下降时的数据量也在不断增加。但是,这些深学习算法的性能改善的数据量增加时。深度学习是机器学习的子集,它获得了不同研究者的关注由于其强度处理大量数据。这就是为什么深度学习在新兴的应用云计算的模式也获得科研界的关注。这些天来,所有的信息在我们的生活中是通过电子设备正在处理。计算机涉及各个领域,需要人类和计算机之间传输的所有信息的帮助下一些高效、快速算法。存在文字识别,有助于提供一个接口,所以人类和电脑能相互影响。这种系统的一个示例位于文档的数字化图像,这可能是手写或打印。 Such systems are relevant in many applications like automatic form processing, postal automation, cheques processing, preservation of historical documents, etc. In this proposed work, recognition of city names that are written in Gurmukhi script is implemented and is one of the application research areas of postal automation. As manual sorting of mails is a cumbersome as well as labor-intensive task due to the high labor cost involved in the process. So, it is required to develop a postal automation system that can read all the necessary fields of the postal document and can help in reaching the document to its destination. Gurmukhi script is the Punjab state’s official language, which is used by the Punjab state’s government officials to communicate their documents. An example of such a document is shown in Figure1,地址字段的文档发布写在果鲁穆奇语(2脚本,“莫哈里(”还强调了这个城市的名字。

一些研究人员已经在邮政自动化领域的工作,和研究已经进行了各种脚本如梵文字母的识别,孟加拉语,英语,俄语,等,但是仍然没有邮政自动化系统存在果鲁穆奇语脚本。本工作提出旨在使用深学习技术基于CNN果鲁穆奇语手写识别的城市名字。各种深度学习技术,CNN是广泛应用于文字识别的目的1]。果鲁穆奇语脚本的识别的最重要的挑战是它的花体字的写作风格,和人物写的如此密切,这使得他们分割一个艰巨的任务。因此,本文提出了使用segmentation-free识别技术方法,称为整体分析。图2手写果鲁穆奇语脚本的示例。

新兴云计算模式,帮助用户通过生成数据在网络的边缘不远云中心的转移。在本节中,给出了文献调查使用事先在新兴的云计算架构。黄等。3使用边缘)提出了一个事先模型计算算法的分类不同的蚊子。检测设备开发的蚊子和预处理的视频在发送之前他们的数据中心。后来,事先模型用于分类的蚊子。同样,刘等人。4)也提出了一个基于CNN事先模型识别的食物。服务器配备使用centos 7.0云。之后,基于CNN模型实现事先识别和分类的食物图像的目的。阿兹米等。5)事先用于心脏疾病的诊断。阅读的文件,上传的本地wi - fi是编程和POST请求边缘设备,一台机器所使用的Apache服务器。侯赛因et al。6]使用云计算优势,提出了事先模型中,数据被发送到中心使用无线接入技术。优势的形成云,MEC服务器使用,后来,一个基于CNN事先用于分类。同样,在邮政自动化领域,即。,for the recognition of various fields like city name, pin code, and street name, a huge amount of data is required. This huge data can be processed efficiently by deep learning algorithms. Among the relevant works, recognition of such fields is done in various scripts using character-level recognition, in which the word is segmented into individual characters before recognition (analytical approach) or word level recognition, which is segmentation-free approach (holistic approach). Pal et al. [7)使用字符级识别使用机器学习识别的多语种印度邮政自动化脚本的城市名称。同样,Thadchanamoorthy et al。8)提出了一种识别技术的泰米尔人的城市名字。获得的精度是96.89%。一些工作的识别密码,都写在不同的脚本喜欢英语,孟加拉等。其中一个例子是Vajda et al。9],作者已经认识到密码写在孟加拉语以及英语脚本使用一个非对称半平面隐马尔科夫模型和实现了94.13%和93%的准确性,分别。Sahoo et al。10)实现了一个全面的方法识别的城市名字写在孟加拉脚本使用形状内容特性,而multiclassifiers用于分类的目的。这里使用的数据是存储在云上的大型数据集。还有一些其他的例子,作者只实现一个全面的方法识别的各种脚本喜欢英语,孟加拉语,阿拉伯语和实现了精度为90.3%,83.64%,63%11- - - - - -13]。Manchala et al。9)神经网络用于识别的英文脚本使用的整体方法。同样,Bhowmik et al。10)提出了孟加拉脚本的识别技术。Wahbi et al。11)在阿拉伯脚本的识别又通过整体的方法,和隐马尔可夫模型用于识别模型。很少有其他作者也用的整体分析识别的文本,在手动提取哪些特征14,15CNN),而其他人则用于字符识别,特征的自动提取(16]。这个提议的目的是采用CNN与整体分析果鲁穆奇语手写识别的城市名字。所有这些技术都使用巨大的数据集,这是存储在云上。

2.1。贡献的工作

(我)手写的数据集有4000个样本图像果鲁穆奇语脚本生成10个城市的名字。(2)CNN模型邮政系统的自动化果鲁穆奇语手写识别的城市名字已经准备。模型可以识别所有的10个城市名字平均验证准确性为99.13%。

3所示。现在的工作

在这工作,提出创建一个数据集4000果鲁穆奇语手写的城市的名字为10个不同的类(城市名),其中每个类有400个样本,可以喂到模型中。人工分拣的邮政文件是一个劳动密集型的任务,因此,识别的城市名称将帮助自动化的旁遮普邦的邮政系统。最后,设计模型预测各种参数识别的城市名字。方法随访识别图所示3

3.1。数据集

准备的数据集,每个样品都是写的40个不同的作家产生了4000个样本的10倍。收集的数据集,两张都给每个作家写每个单词每个五倍表,生成每个单词总10个样本表。所以,每个作家生成100个样本。作家都是选择从不同的年龄组,教育水平,不同的方言。作家都是免费使用任何颜色的钢笔。

3.2。数字化和数据集的预处理

的数字化采集样本,与300 dpi扫描仪是用来扫描收集到的样本。预处理的数据集,每个扫描表转换成灰度图像,然后,标准化执行。此外,亮度调整,对比度调整,和强度级别调整执行之前改善图像质量的种植一词从数字化表样本。Adobe Photoshop的目的是用来对比调整,亮度调整,强度级别调整和裁剪的图像。后,裁剪样本放置在各自按照城市名称命名的文件夹。之后,准备数据集存储在云上,因为它必须使用深度学习网络访问。

一旦完成预处理,数据集分为训练数据集和验证(17,18]。80%的数据保存培训模型,和20%保持验证的性能模型。表1下面是显示城市名称和其相应的手写数字化图像果鲁穆奇语脚本中。

3.3。数据增加

数据增强技术,有助于增加可用的数据。因此,可用数据进一步增加了翻转或旋转图像,和数据增加的内置函数模型。旋转的城市名“阿姆利则”如图4

3.4。模型设计

构建CNN模型,三层是必需的:(i)卷积层;(2)池层;(3)输出层。卷积第一层的主要功能是应用预定义的过滤器重量获得从一个图像的特性。基于加权滤波器使用,产生特征图的数量。提取的特征的复杂性不断增加与增加模型深度,而最后卷积模型的层地图生成功能,这是更接近所需的识别任务。下一层是池层和最常用的池技术是最大池。这进一步有助于保存的特性选择最大值作为最接近所需的功能相似。池层还有助于减少图片的大小通过去除特性,这并不重要。最后一层是完全连接层,并从这里输出类。 The proposed CNN model is shown in Figure5

第一层用于卷积提出工作32过滤器的大小3 3步的1 1 32特征图来自这和卷积层后跟ReLU激活函数。获得的特征图然后传递给max池层2 2滤波器尺寸和2的步伐 2,这意味着池层特性图的大小减少了2倍。获得的混合特征图卷积传递到下一层,64过滤器的大小 3和1的步伐 1,就是再接着最大池大小为2层 2和2的步伐 2,也就是进一步紧随其后的另一个马克斯池层相同的大小。最后,介绍了一个完全连接层与将SoftMax激活函数,有2048个神经元在输入层,120中间神经元层,和10个神经元在过去,即输出层。完全连接层变换获得的特征映射到10类。修正线性单元(ReLu)用作所有层的激活函数模型,除了池层。

4所示。实验和结果

该模型实现数据集的4000张图片的帮助下使用Python Keras Tensorflow,机器学习库。

4.1。实验设置和使用性能指标

模型的效率是受各种参数的影响,但在这篇文章中,三个重要的参数是:优化器,LR,批量大小的模型。优化器是用于更新网络权重;同时,优化器的选择意味着好的结果在几分钟内,数小时或数天。LR告诉如何适应迅速神经元权重,而批大小告诉样品前处理的数量正在更新模型。该模型分析了使用两种不同的优化器,亚当和随机梯度下降法(SGD),三种不同的LRs, 0.001, 0.01,和0.1,和批量大小:2,4,8。众所周知,批量大小是一个重要的hyperparameter深度学习系统。大型批量大小有助于加速计算,但它会导致贫穷的泛化(19]。所以,它总是比使用一个小批量的大小。这模型给了很好的泛化与批量大小的2,4,8只,而准确性大幅减少当批大小进一步增加。响应时间模型的训练和验证不同模型模型,根据训练数据集,批量大小,和LR,而且还取决于系统的硬件使用CPU、GPU,内存等。20.]。评估提议的CNN模型,计算各种参数训练和验证,验证的准确性(21,22)、精度和召回。所有这些参数都是计算使用的不同指标混淆矩阵,这是真阳性(TP),假阳性(FP),真正的负面(TN),假阴性(FN)。参数定义如下:

以下4.4.1。精度

准确的定义是正确的数量的比率所作的预测模型预测的总数中所示

4.1.2。精度

这个度量讲述病例报告这样的比例,实际上是真正的所示

4.1.3。回忆(敏感性)

召回措施的能力设计模型来检测阳性样本。计算为真阳性的总和除以所有类的和真阳性和假阴性的所有类中所示

4.2。结果使用亚当优化批量大小的4

在本节中,得到了各种参数对三种不同的LRs,而亚当优化器使用批处理大小为4。

4.2.1。准备结果LR的0.001

2显示各种参数的值获得的LR 0.001,而优化器使用的是亚当的批量大小4。最大限度获得验证准确性的验证数据集与最小验证损失为0.01 99.8%,平均获得验证的准确性为99.13%。

6显示了不同的参数收敛性情节的训练数据集,以及为验证数据集。Y设在显示获得的特定值,X设在是时代的数量,模型训练。验证精度的主要参数;同时检查模型的性能识别的文本,它可以观察到,准确性情节几乎是增加后的几个时代。最大的获得验证准确率为99.8%。损失的价值应该少,损失获得的最小值是0.01和0.07的验证和训练数据集。其他参数的值接近1,表明该设计模型是很不错的。

结果也可以通过策划混淆矩阵分析。图7显示出情节multiclassification混淆矩阵的结果在图吗6。在X设在预测标签进行描述,而在Y设在,真正的标签进行描述。混淆矩阵告诉关于实际的信息(真正的)和所做的预测分类分类模型而设计的。蓝色框中突出显示的值代表了真正的积极的价值观,告诉多少模型设计的正确预测的积极类作为积极的(23]。例如,对于城市阿姆利则,设计模型准确预测所有的80个样本,同时,城市Fazilka,模型准确预测78样品和正确预测样本作为卢迪亚纳,可以观察到在图7

4.2.2。结果LR的0.01

现在,LR改为0.01,而优化器使用亚当。表3显示各种参数的结果,当LR改变了从0.001到0.01,而其他参数保持不变。从获得的结果,可以发现LR模型的影响精度的结果。10日获得的验证的准确性th时代是99%,和培训的价值损失,验证,验证精度,和验证召回是0.11,0.01,0.99,和0.99,分别。验证获得的平均精度为96.95%,小于平均验证准确性,LR的0.001,这是99.13%。图8显示了参数收敛性情节,混淆矩阵如图9,是不是4类。它可以看到从图8获得的情节不是很线性比图获得的情节6,而线性只能观察到在过去几世(24]。

4.2.3。结果LR的0.1

4显示各种参数的结果,当LR进一步改变了从0.01到0.1,而其他参数保持不变。在10th时代,最大精度验证获得的是99.3%。培训获得的价值损失,确认损失,验证精度,和验证召回是0.10,0.00,0.99和0.99。验证获得的平均精度为98.17%,小于平均验证精度获得LR的0.001,这是99.13%。图10显示了参数收敛性情节,混淆矩阵如图11。在图10,所有的情节都是线性变化的,情节几乎是减少损失和其他情节正在接近1。

从图11混淆矩阵的LR 0.1,它可以观察到,该模型有更进一步的几类相比以前的混淆矩阵。56个样本城市的“Fazilka”, 73个样本城市的Hoshiarpur, 78 Jalandhar等等正确预测。

它可以观察到从表2,3,5的LR模型精度影响识别结果。LR 0.001生成的平均验证准确性99.13%,这是最高相比其他LRs验证获得的精度。

4.2.4。最优LR与亚当优化器选择

验证精度分析中得到了表2,3,5做的图12。这表明亚当优化器的LR 0.001表现更好的为可用数据集。图1210日展示了验证精度获得所有三个LRs时代。Y设在显示验证精度获得,而X设在显示了三种不同的10日LRs时代。它可以观察到10th时代的验证准确性获得0.001相比是最高的LR LR的0.01和0.1。也可以观察到验证精度高使用LR 0.001时代的大部分时间。图13显示了一些错误分类结果的亚当优化器。城市名“卢迪亚纳”并被错误地归类为“邦”图(13日),而城市“Fazilka”并被错误地归类为“卢迪亚纳”图13 (b)

从上面的讨论结果准确性使用LR的亚当优化器0.001,0.01,和0.1,它可以观察到,该模型取得了最好的验证准确性LR为0.001,该模型还更进一步的一些图片。结果如图13

4.3。结果使用亚当优化器:LR 0.001在不同批量大小

从图分析12LR 0.001取得更好的验证精度比LR的0.01和0.1。已经观察到模型的批量大小也影响结果准确性25]。现在,该模型分析了使用三种不同批量大小(2、4、8)与亚当优化和LR 0.001。表6显示不同的结果通过改变批量大小,而使用LR 0.001。从表中可以观察到,批量大小的4给了良好的精度结果相比批大小2和8。最好的验证精度达到平均99.13%当批大小保持在4 97.24%和92.07%时的批量大小8 - 2 LR为0.001。

4.3.1。比较三种不同批量大小使用LR的亚当0.001

它可以看到从图12LR 0.001给好的结果相比LR的0.1和0.01。在表4,得到各种参数使用三种不同批量大小。获得的平均精度验证批大小2 92.07%,批大小4 99.13%,和批量大小8 97.24%。现在,验证精度获得10个不同时代的桌子上4比较图1415通过三种不同批量大小。在图14,Y设在代表验证精度获得,而X设在代表三个不同批次的大小在10世纪和人物15,Y设在代表平均验证准确性,虽然X设在代表批量大小2,4,8。它可以看到从图14批量大小4给更高的精度比其他批量大小,而图15显示平均验证精度高是由一批4的大小。

4.4。结果使用SGD LR的优化器0.001和4批大小

优化器使用在CNN模型也会影响精度。在本节中,获得的结果是使用SGD优化器的LR 0.001和4批大小。LR 0.001和4批大小的选择基于最好的精度结果他们在前面的部分。表7显示各种参数获得的结果使用SGD优化器,而图16显示了参数收敛图和图17显示了相同的混合矩阵。图16显示所有的情节几乎是线性表获得的参数值7。情节在图(16日)、培训和确认损失,与每个时代接近值“0”,在情节人物16 (b)- - - - - -16 (d)培训和验证准确度、精度和召回正在接近“1。“最大验证准确性获得在过去时代是98.8%,小于最佳精度得到亚当优化器。

4.1.1。比较三种不同批量大小的优化器使用SGD LR的0.001

SGD优化器在三个不同的批量大小的比较是在这一节中进行。培训,验证损失,验证准确性,并使用10时代平均验证精度比较。获得的平均精度验证批大小2 87.6%,批大小4 94.18%,和批量大小8 93.31%。它可以观察到从表8最高的平均精度验证是通过批大小4。图18展示了验证准确性使用批处理大小的比较图2,4,8 SGD LR的优化器0.001,而图19显示了平均验证精度的对比图。可以得出结论,在这里,还批大小4工作更好的为可用数据集使用SGD优化器虽然取得验证精度小于验证精度通过亚当优化器。

5。测试的一些图片

在本节中,给出了一些随机选择图像CNN模型,优化器已雇佣了亚当的LR 0.001和4 BS。图20(一个)表明,城市的名字“Fazilka”的形象被公认的准确性达84.12%,而城市的名字“阿姆利则”的形象被公认100%正确。

6。分析

它可以从表进行分析47亚当优化器的LR 0.001和批量大小4给好的结果的平均精度验证。最好的平均精度验证通过亚当是99.13%,而平均验证最佳SGD优化器获得的精度是94.18%。分析情节的平均精度验证通过亚当优化和SGD优化器如图21。可以得出的结论是,亚当的LR 0.001和4批大小表现更好比SGD优化器使用相同的LR和批量大小。

7所示。结论

深层学习是机器学习应用于大型数据集。深度学习需要大量的数据来训练网络,它可以存储在云上。因此,云计算有助于简化深度学习访问和处理大量的数据,而且,训练算法可以很容易地在分布式硬件。它还帮助提供访问等各种硬件配置fpga, gpu,高性能计算系统。它可以得出的结论是,新兴的云计算模式很适合工作学习算法,而不是传统的算法。深度学习模型的性能取决于各种hyperparameters LR、批量大小,选择优化,等等。在表中2,3,5,得到了各种参数优化器使用一个亚当LR的0.001,0.01,和0.1,和获得的平均验证精度是99.13%,96.9%,98.17%。表4也获得了平均精度验证通过改变批量大小的2,4,8,LR保持固定在0.001。结果分析了通过改变亚当优化器为LR SGD优化器为0.001。平均精度验证获得了SGD优化器使用批量大小的2,4,8是87.6%,94.18%,和93.31%,而最好的平均精度验证通过亚当和SGD是99.13%和94.18%,分别。从上面的实验,观察到亚当优化器的批量大小4和0.001的LR取得最好的平均验证精度99.13%。在未来,这个模型可以实现对文字识别其他脚本。

数据可用性

可用的数据将从作者要求((电子邮件保护))。

的利益冲突

作者宣称没有利益冲突。