文摘
邮政系统自动化领域的主要研究范围自动化。为印度这样的国家创建邮政自动化设置是一项乏味的工作,如果与其他国家相比,因为印度多脚本和多语种的行为。这项工作将有助于认识到“果鲁穆奇语”手写的旁遮普地区国家的名字。认识到该地区的名字,CNN-based架构提出了采用一个整体的方法。为此,22000个样本的一个图像数据库是准备有1000个样本图像每一个地区的名字是来自500个不同的作家。最大精度验证数据通过该模型是99%。
1。介绍
人工智能(AI)之间的鸿沟是人类和计算机的功能。这样一个领域是计算机视觉1]。这一领域的主要目的是让计算机像人类,认为它以同样的方式,并使用图像识别的知识等各种任务,图像分析,图像分类、自然语言处理(NLP),等等。同样,识别的文本可以通过使用深度学习艾城的子集。在这方面,自动进行特征提取和分类(1]。地区名称识别有助于邮政系统的自动化。开发一个邮政自动化系统为国家印度是一个单调乏味的任务几乎每个国家都有自己的脚本(2]。在这工作,提出果鲁穆奇语脚本被认为是旁遮普省政府宣布这是官方语言。地址要张贴在所有的官方文件通常是用果鲁穆奇语编写的脚本。
的认可,整体的方法是用来代替分析方法(3]。在整体的方法中,词的识别不是分为单个字符,而不是一个完整的单词是公认而在分析方法中,词到字符的分割完成(4]。果鲁穆奇语是草书书法和汉字写这个词通常是接近对方,识别的单词使用的分析方法不能产生良好的识别结果。
这项工作将有助于自动旁遮普地区的名称读取状态。这个脚本有35个字符,6辅音,元音和9。它的写作风格是(从左到右3]。这项工作的目的是产生一个系统,可以让成功识别的手写的字没有他们的分割。在这篇文章中,作者的主要贡献如下:(一)22000手写的图像数据集创建的旁遮普地区的500年作家了(b)深上优于模型可以帮助自动化国家邮政系统的旁遮普(c)结果所获得的该模型获得的与其他先进的模型
论文的结构如下。节2、邮政工作自动化,在部分3、研究方法的工作。结果和分析介绍了部分4的手稿,并给出结论5。
这个手稿已经被提出作为Shodhganga论文,水库的印度论文根据链接:https://shodhganga.inflibnet.ac.in/handle/10603/347820这是作者本身的工作,论文标题为“CNN-Based承认地区果鲁穆奇语旁遮普州脚本的名称。”
2。相关工作
在本节中,文献调查的邮政自动化领域的工作。有很多领域,存在等邮政文件地址或pin码数字,城市名称,街道名称,和国家的名字。地址或pin码可能包括数字单词字母代表城市名,街道名称,或国家的名字。Sharma et al。5提出了一个为邮政自动化工作。CNN模型识别和检测介绍了密码。模型上实现2300写手写的英语和孟加拉pin码位数。不同体系结构网络是使用像Zeiler和参考小组,视觉几何组(16),和VGG_M。相当大的结果获得了识别密码VGG_M就业的复发性卷积神经网络模型。Pincode盒子也承认使用Zeiler和参考小组的准确性达88%。56%的准确率是获得使用VGG_M pin码区域的检测。87%的准确率得到使用VGG16完整地址区域的识别。
确定18000年手写的城市名字都写在果鲁穆奇语,邦萨尔et al。6提出了一种方法。收集的数据集来自60个不同的作家,作家创造了30样品的每个城市的名字。从16200年总创建数据集,用于使网络模型能够分析网络模型学习和休息。预处理对收集到的数据集也做像图像的二值化,规范化,也稀疏的操作。斜树提取技术是采用预处理图像,以便可以提取的各种特性。再等特点(资讯)和支持向量机(svm)。识别精度最高的帮助下获得90.8%的支持向量机分类器。同样,Thadchanamorthy et al。7]介绍了一种技术来识别城市名字都写在泰米尔脚本。创建数据库拥有265名泰米尔手写的城市名称。识别是进行单个字符分割后的单词。各种特性的分割字符计算的帮助下修改后的二次判别函数(MQDF)。实现精度为96.89%。朋友等。8]也开发了一个模型来识别城市的名字都写在不同的脚本。纠正斜手写文本,采用倾斜校正方法。下一步是细分成字符。模型测试在16132 l手写的城市名称的准确性为92.25%。同样,朋友等。9]也开发了一种技术,手写识别和分类的城市名称,用孟加拉语写的。
温家宝et al。(10]阐述了手写数字的识别方法在孟加拉脚本。在数字识别的预处理步骤,首先的数字写在邮编的位置,这样就可以将分段。特征提取完成后的预处理步骤。两种不同的方法用来认识到孟加拉数字。在一个方法中,图像进行重建,和其他方法,特征提取是进行进一步结合主成分分析(PCA)方法。获得的平均精度为目的的识别是95.6%。Nurseitov et al。11]也开发了两个CNN模型网络识别手写的名字的城市。初始模型对CNN进行操作,而第二个使用递归神经网络(RNN)。解码,联结主义时间分类算法实现。数据集与42 21000图像使用不同类别的城市名称是由500年作家写的。获得第一个模型精度55.3%,其他模型获得的精度是75.1%。Sahoo et al。12)引入了一个方法来认识到孟加拉手写的城市名字。整体的方法是使用。识别是进行50流行的孟加拉的名字,每个城市有150个样本。一旦提取特征,然后各种分类器就像多层感知器(MLP)和序列最小优化(SMO)用于图像的分类。
在本节中,一个努力已经取得了目前的工作,已经完成在邮政领域自动化。
3所示。提出了研究方法
研究工作提出了图的方法1。
开发研究方法来识别旁遮普地区的名称。在这里,一个全面的方法用于单词的细分的目的不是进行。所有的操作都是在整个单词。CNN模型训练和测试在Python使用keras和Tensorflow库平台。准备数据集,使用Adobe Photoshop。
3.1。数据集
首先,收集到的数据集需要的CNN模型可以识别的目的。作为识别是进行22区名称,22000果鲁穆奇语手写数据集创建图像,而1000数据集图像样本创建为每个地区名。
创建数据集的果鲁穆奇语手写文字,手写数据集样本收集从500年的基础上选择不同的作家不同的年龄段,不同的教育和专业背景。示例表写的作家在图所示2。
(一)
(b)
3.2。数字化和预处理
收集后手写的表,每个表使用的扫描数字化设定在300 dpi分辨率。扫描图像如图3。
(一)
(b)
接下来,升级扫描表的质量,一些预处理技术。预处理的目的,Adobe Photoshop已经使用。预处理,亮度,像素强度,和对比度值调整。之后,这句话出现从整个表。表1显示出几个准备数据集的图像。
3.3。把数据集
下一步准备后的数据集划分成80:20比例。200年各地名称的图像将保持验证为目的的,而一些额外的看不见的图像将用于测试模型。
3.4。构建提出了CNN模型
创建一个CNN模型识别地区名称。网络将预测模型精度损失,回忆,和精度。模型由三层组成:(a)“卷积”,“max-pooling,”和“压扁”层。
层,即。,convolution and pooling help to preserve the important features of the given data images. The obtained features are converted into a column with the help of flattening layer so that they can be easily fed to the last layer of the model which helps to classify the output. The architecture network of the suggested CNN model is given in Figure4。这个模型有12层,4双卷积和汇聚层,其次是1肥育层,2致密层和输出层。过滤器尺寸是3×3同时卷积过滤器中使用不同的层的数量是32过滤器在第一层,64年第二过滤器,过滤器在第三层,128和256过滤器是用于最后一层。在马克斯池层有一个2×2的大小。
3.5。网络的训练和测试
现在建议CNN网络模型训练数据集开发和测试。规范像精度(13),记得,损失,和精密的计算。计算使用混淆矩阵的离散指标(CM)。参数用来模拟模型如表所示2。模型执行最好的采用值的组合表2。改变任何值,模型的性能恶化或保持不变(14]。进一步增加模型中的层数,获得的精度保持不变但模型的培训所花费的时间增加(15]。
4所示。结果和分析
在本部分中,得到不同的结果在训练和验证数据集。结果见表3。价值获得培训损失降至最低是0.05获得45时代。验证数据集,损失了0.08,精度99.0%,召回和精密获得0.99最后一个时代。从该模型,验证获得的最高精度为99%。
图5介绍了情节曲线获得的值在表3。图5(一个)显示的最大2.3验证损失了第三时代。从第四时代开始,验证数据集的损失曲线几乎是减少波动而训练的曲线是线性减少损失。在图5 (b)为验证精度,精度最低第三时代但从第四期开始它的曲线也在增长,而训练损失是一个线性改变它的值。情节为验证数据集使用召回和精度参数如图5 (c)和5 (d)。训练数据集的曲线近似接近0.99。
(一)
(b)
(c)
(d)
精度值,F1的分数值,和回忆的价值也计算为每个地区名称如图6- - - - - -8。图6表明模型是实现高精度的识别给定地区的100%。珀,阿姆利则,Fazilka Jalandhar、Hoshiarpur Gurdaspur,莫哈里(,Sangrur, Nawanshahr,和Ropar精度值已经达到1,最低0.96实现地区的价值:“Fathegarh大人。“在图7回忆,值为1或100%“阿姆利则,”珀”,“Barnala”,“Fathegarh先生,”“Mansa,”和“Hoshiarpur”和最小值通过Kapurthala区”。“图8显示了F1-score;获得价值100%地区“阿姆利则,”“珀”,“法利德果德,”“莫哈里(”等等,和最低分数是获得地区“Kapurthala。”
厘米的提议CNN模型图9。正如已经提到的,从每个地区80%的图片名称保存为目的的培训和20%保持测试的目的。这意味着800年各地的图像用于训练和其余200测试模型。图9表明该模型正确猜测所有区划:“阿姆利则,”“法利德果德,”“珀”,和“Fazilka。”
4.1。测试的图片
这里,测试准备的一些图像数据集使用该模型,和结果呈现在图10。在图10 ()地区名称“Sangrur”是85%正确的测试。
(一)
(b)
(c)
同样,地区名称“阿姆利则是100%的正确预测,并预测28%,“Muktsar”也在图10 (b)。因此,它可以被声明为“阿姆利则地区名称。“图10 (c)表明,该地区的名字“分公司”是99.9%正确预测。
4.2。与现有模型进行比较分析
表4显示的比较提出了使用前可用的方法。表4使用各种脚本代表精度参数结果。
5。结论
摘要CNN模型发展到认识到22区旁遮普的名字。因此,一个数据集生成了不同的作家果鲁穆奇语的识别手写的脚本。识别旁遮普地区的名字是邮政自动化的应用领域,这将有助于在自动分拣邮件在邮局。这项工作也有助于识别手写果鲁穆奇语单词没有将他们划分为单个字符以及该模型也消除了需要的人工特征提取需要训练模型。实现CNN模型已得到验证的准确性99.0%和95.6%的平均精度验证。在这个模型中,一个“亚当”“0.001 LR的使用。”层的数量是12而使用的时代数量是45。一篇论文之前发表了该模型(链接为同一已经获得)。观察到在时代的进一步增加和层数,精度保持不变。所以,这个模型提供了相当好的果鲁穆奇语手写文本识别的准确性。
数据可用性
数据可以从作者。
的利益冲突
作者宣称没有利益冲突。
确认
作者要感谢塔伊夫大学的研究人员支持项目TURSP-2020/125数量,塔伊夫大学,塔伊夫,沙特阿拉伯。