文摘
在本文中,我们利用二维数据通过t-Stochastic社区嵌入(t-SNE)应用于高维数据的乌尔都语手写字符和数字。数据集的实例用于实验工作在多个类进行分类根据形状相似。我们三个任务执行在一个有序的秩序;即(我)我们生成一个先进的数据集的乌尔都语手写字符和数字,邀请一些本地乌尔都语参与者从不同的社会和学术团体,由于没有公开的数据集的类型,直到目前为止,然后(ii)应用经典的维数降低及数据可视化的方法和主成分分析(PCA)一样,Autoencoders (AE)相比,t随机邻域嵌入(t-SNE),和(3)使用降低维度通过PCA, AE,t新力乌尔都语手写字符的识别和数字使用深度网络卷积神经网络(CNN)。乌尔都语字符和数字的准确性实现识别方法中相同的任务是发现好多了。新颖性在于结果减少维度用于第一次乌尔都语手写文本识别的字符级别而不是使用整个多维数据。这导致消耗更少的计算时间与相同的精度与处理时间相比被识别方法应用于其他数据集使用整个数据相同的任务。
1。介绍
数据可视化处理提出一些视觉上下文中的数据,让它微不足道的人类的理解数据的性质(1]。此外,这项活动有助于发现模式和隐藏信息,如果他们存在,等进一步处理的数据的数据聚类和数据分类。如今,它是共同观察到相关信息数据的科学是高维度,因此,其在低维空间变得不切实际的可视化(Buja et al。2];赛义德et al。1])。在几乎所有的科学数据集的数据,研究人员不得不处理这个急性和关键问题。分析高维数据的时候,几乎所有的其他研究人员感兴趣的是找到最优数量的维度(或特性)为了应用任何适当的分类器给更好的性能(Nguyen和福尔摩斯3];歌等。4];ur Rehman et al。5])。是相关条款提到“高维数据可视化”和“高维可视化”是可以互换的文学;然而,有一个简洁的区别。首先,这个术语高指的是数据本身,而在第二个,它指的是可视化。有趣的事实在于可视化的高维数据2 d或3 d飞机上,我们必须应用一些适当的降维方法对整个数据,因为它是几乎不可能以可视化高维数据在低维空间(恩格尔et al。6];歌等。4];ur Rehman et al。5])。
“维度”一词是指变量的数量,特征或功能领域的大多数数据集存在数据科学了。一般来说,这些维度表示为列,主要目的是减少这个数字的列。在大多数情况下,这些列值相关,也导致噪音数据冗余信息。这种冗余信息可能影响消极和负面影响在训练中任何机器学习模型从而产生容易出错的结果。这就是原因,已成为至关重要的降维方法。此外,它还有助于发现模式,如果他们存在,之前的数据集应用任何聚类或分类方法通过减少模型的复杂性从而避免过度拟合。
降维技术的关键目标之一是减少高维数据点D=d1,d2,d3、…dn而低维度空间,理想情况下,在两个(或三个)维空间年代=年代1,年代2,年代3、…年代n为了得到更好的可视化数据,年代代表的等效低维转换和映射D和年代我相应的数据点的d我可以认为在一些合适的散点图。这一转变的主要目的是保持高维数据的特征尽可能同时转换到低维空间。是相关提到不同的降维方法有许多不同功能的保持高维数据的不同类型的属性(恩格尔et al。6];赛义德et al。1];Sorzano et al。7])。一些特定于保持线性依赖关系,有些专家照顾非线性特性。为了解决这些挑战,我们最受欢迎的和广泛使用的算法t分布式随机邻居嵌入(t新力)(Maaten和辛顿(9])。结果表明,t新力产生很忠实的集群清晰和准确的分离而转换成低维数据,从而保持高维数据的特征。此外,减少尺寸然后插入卷积神经网络(CNN)识别和分类的乌尔都语手写数字和字符在一个单独的组实验。结果的质量和效率维度通过使用减少t新力明显比先前的方法用于表示目的。
本文概述如下:部分2降维方法的概述。节3我们工作,我们将讨论背后的动机。节4处理步骤,用于生成技术发展水平数据集进行了较为详细的试验研究。实验结果获得通过使用维度通过减少t新力和其他方法介绍部分5。部分6提供乌尔都语手写字符的识别结果和数字使用基于深CNN模型。节7我们得出结论本文提出一些未来的工作。
2。复习的方法用于降维
大量的非线性数据降维方法提出了在过去十年(Camastra [10];坎宁安和Ghahramani [11];Sorzano et al。7])。非线性技术更能比较标准和传统的线性降维技术;在处理复杂的非线性数据,因为大多数的数据集与数据相关的科学和大数据可能会强烈非线性性质(蔡12];Van Der Maaten et al。8])。相关文献认为,在现有的降维技术,主成分分析(PCA) (Roweis扫罗13)被认为是最受欢迎的(无监督)线性技术(犹太哲学家和Rokach [14];扫罗et al。15];蔡(12])。因此,在本文中,我们考虑了PCA Roweis扫罗(13作为基准。还存在其他技术如多维扩展(MDS) Torgerson [16)线性形式的数据。这种方法主要侧重于不同的数据点的结构性质相似。提到是相关人员必须考虑非线性高维数据的特点也非常相似的数据点产生清晰的分离的集群。这个活动还可以帮助解决问题与星团内分离有关。
一些值得注意的调查文章(Camastra [10];坎宁安和Ghahramani [11];Sorzano et al。7])提供关于降维方法的详细信息包括局部线性嵌入(米歇尔)(Roweis扫罗(13]);拉普拉斯算子Eigenmaps(贝尔金和他(17]);最大方差展开(MVU)(温伯格et al。18]);随机邻居嵌入(SNE)(辛顿和Roweis [19]);和曲线成分分析(CCA) (Demartines和Herault [20.]),专门处理非线性数据保存整个数据的结构特点。也得出结论从恩格尔等的工作。6)和Maaten和辛顿(9],上述方法不产生有效的可视化结果,因为这些方法未能管理整个数据的非线性特点的低维投影地图。因此,这些方法不推荐获得现实的正确和完善的可视化数据集在高维数据点。作者恩格尔et al。6),Maaten和辛顿(9),和歌曲,车载,Borgwardt Smola [21]也观察到MVU未能想象英语手写数字和提供高度重叠的集群。为了解决这些问题,我们使用了t分布式随机邻居嵌入(t新力)(Maaten和辛顿(9])方法产生一个高效和有效的可视化多维数据集群的形式清晰和准确的分离通过嵌入像素——和示例信息原则。这是相关的提到t新力是一种修改和扩展的新力(辛顿和Roweis [19])。降维技术的分类如图1。
相关文献的概念t-SNE总结说,这也是一个维数降低及数据可视化技术,有效地处理非线性数据,因为t-SNE背后的数学是非常复杂的,但这个想法很简单。t-SNE的功效是它的新奇嵌入点从更高维度较低维度试图保护特定点的邻居更有效地比其他传统和古典方法像PCA, auto-encoders,高度的相关性过滤器,等。最经典的降维方法固有的工作保护全球的数据结构,而t-SNE标签关注当地和全球的属性数据。这种新奇的t-SNE协助生成与高度的密实度和集群intercluster分离。
3所示。我们的动力
在这项工作中,我们做了个实验在两个阶段,即(i)的可视化乌尔都语手写字符和数字包含基于像素特征与功能使用降维方法示例嵌入式,(2)这些字符和数字的识别使用CNN使用基于像素的深层网络模型和基于结构的特性,然后利用减少尺寸相同的情况下通过t新力和其他方法。为了执行上述任务,我们准备了一个新颖的数据集乌尔都语手写字符和数字。
乌尔都语脚本的一个问题是其字符和数字之间的形状相似,如图2。
(一)
(b)
这些问题可能会导致产生重叠集群在可视化在低维空间中,这可能直接影响识别的准确率。因此,我们要用一些合适的方法,结果准确和正确的集群与完美的分离。此外,星团内分离的数据实例应该清楚描述之间的分离的单个实例乌尔都语字符和数字。以下因素和问题的原因我们的动力执行一些实验来解决这些问题。
我们所知,迄今缺乏值得注意的工作为了变换忠实地乌尔都语手写字符低维的高维数据空间。(我)没有数据集与乌尔都语手写字符和数字可用公开执行文本识别任务人物等级。(2)也,没有过程乌尔都语手写字符识别采用的水平文本使用减少维度通过降维方法。(3)在随后的部分中,我们概述的过程生成一个先进的数据集的图像组成的乌尔都语手写字符和数字。此外,实验结果产生的维数降低及识别方法在后续部分中给出。
4所示。数据集的准备
正如前面提到的部分,有一个缺乏一个合适的和简洁的数据包含乌尔都语语料库手写字符和数字字符级别执行文本识别任务。有一些公开数据集的乌尔都语手写文本像乌尔都语Nastaliq手写数据集(UNHD) (Ahmed et al。22];Das et al。23];Husnain et al。24];Sagheer et al。25]),但不幸的是,数据集只有乌尔都语手写数字。此外,这些实例是不够的应用先进的机器学习算法,从而获得更好的结果。为了缩小差距,并提供先进的数据集,我们邀请了大约1000名本土乌尔都语说话人从不同的学术、行政和社会群体的不同年龄组和性别。此外,残疾人和残疾人身体上也使数据更简洁和全面。所有的作者都是直接写在一个单独的列中印花床单在他(或她)的笔迹。每个表都有打印的图像40基本乌尔都语字母表以及10乌尔都语数字Nastaliq字体。
图3描述了样本数据集的页面。此外,我们还记录了每个作者的人口统计信息来生成地面真值的整个数据集。这信息包括每个作者的基本信息,也就是说,年龄,种族,性别,教育程度,类型的工作,身体残疾(如果有的话),偏好的左(或右)手而写作,等等。这个活动帮助我们更加简洁和全面的数据集。适量的数据实例集合后,手写页的乌尔都语字符和数字都仔细扫描平板扫描仪在标准的300 dpi的分辨率。此外,扫描页面然后手动分割成一个图像的大小×28日至28日单独捕获乌尔都语手写字符和数字。如前所述,整个数据集包含1000×10 = 10000乌尔都语数字和1000×40 = 40000。
(一)
(b)
(c)
乌尔都语字符图片:对于实验工作,我们随机选择了6000名(600每十个数字)乌尔都语的图片数字和28,40 000(700字符)乌尔都语字符的图像。相关的更不用说,我们计划增加参与者的数量到1500年以包括尽可能多的不同的笔迹的变化创造更多的全面的和多方面的数据。完整的数据集,完成之后,研究人员将向公众公开,因为没有这样的数据集,直到日期。是很常见的噪声和失真可能可能发生在扫描图像。为了消除噪音,我们指导作者只能用黑色墨水。这个活动使噪声去除过程,而琐碎的任务,黑色以外的颜色被认为是噪音和轻松地删除。此外,在应用任何降维方法,我们利用一些数据转换算法,如灰度转换,图像分割,图像缩放,从文本中提取感兴趣的领域的形象,规范的原始数据,等等,准备我们的数据集在一些适当的形式。更相关的是乌尔都语字符如图4数字用阿拉伯语和波斯语共同字符;因此,我们的方法也同样适用于这些领域也有一些小的修改。
5。降维方法的实验结果
在本节中,我们目前获得的结果运用PCA (Roweis扫罗13)、AE和t新力在我们两个不同的数据集。一种变体包含基于像素特征的乌尔都语数字和字符。第二个变量包含示例乌尔都语的特性与基于像素数据嵌入数字和字符。实验结果描述添加基于结构的特性提出了可视化结果与准确的分离在集群和还维护星团内的变化。
正如前面所提到的,我们代表每个文本图像数据集在28日×28 = 784像素值(或尺寸)。评估的目的,我们使用三种不同的降维方法,即主成分分析(PCA) (Roweis扫罗13]);Autoencoders (Liou et al。26]);和t新力(Van Der Maaten et al。8])乌尔都语手写字符和数字数据集。
我们使用以下参数设置在使用t新力(Van Der Maaten et al。8])和它的变体而生产可视化结果:迭代的数量,T设置为1000,以达到优化的梯度下降法,动量词,调整参数α(t),调整为0。5,t小于250,α(t)设置为0。8t大于250。学习速率的初始值η被设置为100,可能是监管为每个迭代配备一个高度自适应学习速率方案。相关的提及,实验使用不同初始学习利率执行;然而,我们观察到的变化结果的可视化结果的质量。此外,随着其他参数,困惑是一个可调参数,描述了如何对应和规范化的局部和全局方面数据。换句话说,我们可以说困惑帮助找到多少近邻每个点都有。它也有一个复杂的影响结果的可视化,在最初的解释t新力论文(Maaten和辛顿(9])。困惑的选择最优的价值具有十分重要的意义;因此,你必须有照顾,因为它只能通过生产多个可视化不同困惑的价值观。因此,在本文中,我们选择了基于可视化的质量最好的结果。此外,它是一个有趣的事实标准,提出了两种版本t新力同样工作,统一在一个假设的价值困惑对整个数据集。下面的小节描述了通过标准生成的结果t新力在我们提出的数据集。
5.1。应用标准t-SNE
通过标准的结果t新力的数据集的基于像素的信息只有乌尔都语手写数字图所示5。很明显的结果,有一些重叠集群而只考虑基于像素信息。我们进行了一系列的实验t新力在相同的数据集使用多个困惑的价值观。观察到的输出,困惑值70,结果显示一些改进的分离在每一堂课的集群的乌尔都语手写数字的使用不同的困惑与结果相比值30日50和100。
(一)
(b)
(c)
(d)
一般观察,困惑价值较低,数据的局部结构倾向于显示更高的毅力,即。集群有较少的数据点绘制非常接近彼此导致一个紧凑的可视化。另一方面,困惑的价值越高,越高的毅力在全球结构数据;即。,the data points will be plotted with some notable difference (intracluster difference) and also maintaining the separation between the clusters (intercluster difference).
图6描述的详细描述乌尔都语的数字和字符的结构特征。获得的结果通过应用标准t新力的数据集有一个像素的组合和功能示例如图7。结果描述了改进生产具有明显的集群分离。从结果呈现在图7,它可以很容易地观察到,一些乌尔都语数字2、3和4有重叠集群。这个重叠是基于这些乌尔都语数字分享形状相似。类似的行为也可以目睹的乌尔都语数字0和1。它可以得出结论,结合像素(即。(即784特性)和示例特征。,10features) failed to be useful when applied to the standardt新力算法。
(一)
(b)
(c)
(d)
同样的方法的标准t新力乌尔都语手写字符的应用于数据集。一个数据集包含基于像素数据,另一个包含基于像素和结构特性。相关的,只有那些乌尔都语字符被认为是实验的形状相似。图8显示的是乌尔都语字符组合形状相似性的基础上。剩余的字符不考虑减少ink-noise比同时可视化单独的40个字符。因此,最好是可视化字符分组根据形状相似。
图9显示的结果应用标准t新力在前面提到的乌尔都语手写字符的数据集。提到是相关结果显示中选择更好的结果由微调参数。结果在图之一9(一个)显示的一些集群重叠显示高于其他集群。这种重叠是由于形状相似的字符组2,10和11所示。类似的行为是观察到的字符组3和9;组4和5;和组6和7。只有组1、组8和组12个字符是正确的t新力。这个问题在一定程度上解决了重叠的嵌入乌尔都语字符的结构特征,正如我们已经用乌尔都语数字。结果如图9所示(b)描绘了更好的结果。星团内分离比先前的结果。然而,有一个需要修改的标准t新力算法,使其能产生更精确的结果。解决这些问题,提出了一种新奇的想法来构建一个融合矩阵有双向的欧几里得距离的(或多个)独立(即观测空间。像素和示例信息)。标准的t新力然后协助融合矩阵中的数据修改。细节融合的数据矩阵和修改t新力后续部分中给出。
(一)
(b)
5.2。融合数据矩阵
在本节中,我们讨论了小说中嵌入两个或多个观测空间的方法通过计算实例的成对欧几里得距离导致融合矩阵。此外,我们还修改了标准t新力使它能够协助数据融合矩阵形式。在我们的数据集,我们构建一个融合计算成对欧几里得距离矩阵的数据实例的两个独立的空间,即像素,基于结构的信息。结果融合然后插入修改后的矩阵t新力,利用前面提到的特性。这个修改t-SNE会给同等重要的特性,从而产生更加清楚和准确的集群与精确的分离。以来我们的假设在于来自两个独立空间数据源的数据是高度结合的依赖,因此,他们的融合将产生更精确的可视化结果在一些低维空间可视化结果相比,使用基于像素数据或生成的输出结构数据。
基于像素特征保存在一个矩阵形式的大小1×n乌尔都语手写字符的单个图像n是每个图像的pixel-wise二进制数据的大小32×3。如果我们考虑乌尔都语数字(例如),我们使用5000乌尔都语手写数字的图像(500每十个数字)为我们的实验工作;因此,数据集的大小是500×32。基于像素的信息然后嵌入的结构特点,利用欧氏距离,乌尔都语的手写数字。自从乌尔都语数字分享形状相似,例如,数字2和3(如图2),这些结构性基础功能嵌入到基于像素特征减少可视化问题,同时策划类似形状的图像。此外,我们引入方程(1)来平衡这两个独立的原始的加权组合空间。这是相关的提到t新力作品的可调参数称为困惑,可以看作是“相邻点的数量t新力必须考虑”,我们使用不同的困惑值包含整个数据。t新力收缩广泛的数据和扩展密集的数据。因此,建议不决定的大小和密度/扩散/方差集群基于输出。此外,方程(1)用于计算融合欧几里得距离的最小值,在赢得价值中发挥作用的独立空间。这部小说活动帮助我们在执行融合过程在一个高效的、有原则的方式,让它几乎独立空间的贡献同样为了维持集群中的数据实例的分离。为了使平等的贡献两个独立的空间,我们分配同等重量(α(t)= 0。5)空间。
在方程(1),我们计算出类似模式以一种非常自律的方式可能存在于数据实例的独立空间的值是由像素空间P和结构属性年代。相对重量,α,描述了数据实例的相似性之间的相对权重的独立空间。而t描绘时代数字描绘的迭代次数降维过程。α是精心设置为0。5观察相同贡献的两个独立的空间。该优化有助于定位的最低融合欧几里得距离(欧几里得融合(a、b)),这反过来决定了共同的成功定位单元。相关的提,为了规范化欧几里得距离的两个独立的空间(方程(1)),我们应用产品配方。这个活动中发挥了关键作用,改善结果通过维护intercluster分色可视化在低维度。在下一节中,我们讨论了我们的修改的结果t新力(Van Der Maaten et al。8]);PCA (Roweis扫罗13]);和AE (Liou et al。26])。
二维空间减少的原因是观察高数据的行为,协助寻找模式(如果存在的话)。这个活动引导研究人员应用合适的分类器。由此产生的二维特性,在我们的案例中,代表(x,y)的坐标t-SNE绘制的每个实例。这些2 d功能正确代表每个实例在地图上是否相似的形状。因此,这些信息可以用于分类的目的使用任何分类器。我们CNN阿甘用于减少维度数据,因为它是仅用于分类使用基于像素数据。是相关提到2 d并不意味着内核滑动窗口;这意味着CNN接受两个输入的情况下减少维度。
5.3。复杂度的比较标准t新力t-SNE和修改
在最初的源文件(Maaten和辛顿(9];Van Der Maaten et al。8]),标准t新力的计算和内存成本O(n2),n数据点的数量,限制该技术的应用。我们进化算法减少计算复杂度O(n日志(n))和内存的复杂性O(n)由于数据来自两个独立分布总体金额的标准化术语n×(n−1)对独特的对象(见方程1)。它也观察到t新力尺度对象数量的平方n,其适用性有限数据集只有几千输入对象。
5.4。实验结果通过PCA、AE和t-SNE修改
在本节中,我们介绍了可视化融合结果矩阵乌尔都语手写的数字和字符的数据集。结果显示(见图10),我们的修改t新力与融合数据矩阵数据集的表现优于PCA和AE的经典方法。
(一)
(b)
(c)
同样,尽管可视化融合矩阵的乌尔都语手写字符,我们应用同一套算法拥有相同的参数设置。图11显示可视化结果当应用于乌尔都语手写字符。
(一)
(b)
(c)
6。使用深度网络乌尔都语手写字符的识别
我们利用深卷积神经网络(CNN)模型和一个输出层生成输出特性映射以识别乌尔都语手写字符。CNN的深度网络,广泛应用于图像分类问题和识别由于其精度高。CNN遵循一个层次模型,建立一个网络,就像一个漏斗,最后给出了一个完全连接层,所有的神经元相互连接,处理和输出。此外,我们使用二维卷积层,适合处理二维图像。与其他图像分类算法相比,cnn实际使用很少的预处理。我们的模型的关键目标是将给定的输入的10类乌尔都语手写数字。另一方面,相同的模型也将用于给定的乌尔都语字符分类的12类乌尔都语手写字符(参见图8)。
在图像处理相关的研究活动,观察到CNN和它的变体是最广泛使用的。在处理二维图像,我们使用2 VGG16模型配备16 -和19-layer网络能够处理的最大输入大小为224×224。它被认为是一个优秀的视觉模型的架构至今为止。VGG16最独特之处在于,而不是大量的hyperparameters,它专注于在卷积的3×3层过滤器与一个跨步1和总是使用相同的填充和最大池层2×2步2的过滤器。在高维数据的分析我们的手稿,我们随着剥削的结构和基于像素的数据以生成精确的分类结果。为了解决这个问题,我们做标准t新力兼容我们的数据通过实现成对欧几里德距离公式数据集的数据点。这个活动嵌入数据点来自两个独立的空间在一个空间,从而使它与标准兼容t新力。
值得注意的是我们没有减少图片的大小;相反,我们减少了特征空间的维数,也就是说,嵌入式版本的结构和基于像素的特性。这些减少维度产生的降维方法在上述章节中详细讨论。这个reduced-dimensional数据然后插入该模型的CNN为了认识到数字(或角色)数据。这个活动需要最小时间(12 CPU秒)和报告相同分类的准确率乌尔都语手写字符和数字与相同的模型应用于文本的原始尺寸图片,在我们的工作(Husnain et al。27),需要8分钟。相关的提,不需要增加卷积核的数量模型的我们在以前的工作表现(Husnain et al。27)由于输入数据的尺寸太小了,他们可以处理非常CNN的原始模型。
为了降低质量的模棱两可的结果,我们进行了一系列的实验使用不同的变化n倍交叉验证。这个活动有助于撤退偏见之间的混乱结果通过传统的训练和测试数据的比例。表1和2描述乌尔都语手写数字的混淆矩阵,平均精度为96。5%,94。7%,分别。
同样的,表3和4显示的结果乌尔都语手写字符(团体在图所示8)。CNN的结果表明,我们建议的模型比前面的方法来执行该任务,见下表5。我们也提出了比较的结果由我们提出的模型和相关的一些先进的方法相同的任务表5。它可以观察到,我们的方法是更好的参数的数量而言,准确性,使用的尺寸数量,数量的计算。
以下是使用背后的原因k倍交叉验证,其变异,计算时间减少我们重复这个过程,只有当价值的10倍k是10。它也减少了biasness结果在使用传统的70 - 30 training-testing比率,从而限制使分类器严格选择的数据点指定的训练数据。此外,每一个数据点被完全测试一次,至少在培训过程中使用k- 1次。同样的,由此产生的方差估计是减少的价值k增加,也就是说,我们之所以使用交叉验证观察10年和8倍方差的变化。
我们建议的模型被发现很有效(准确性)的和有效的在执行识别和分类任务的方法到目前为止用于相同的任务。我们工作的新颖性在于减少维度通过不同的降维方法首次用于乌尔都语手写字符的识别。此外,我们建议的方法也同样适用于开发一个有效的在线和离线字符识别系统移动或手持设备对儿童学习应用。
7所示。结论
在本文中,我们利用减少维度通过像PCA降维方法,AE,t新力,乌尔都语手写字符和数字的识别。此外,每个手写字符的结构特征提取并嵌入到数据集的基于像素特征丰富的特性。为了使它更适合,我们修改了标准t新力包括支持成对欧几里得距离方程的特征从两个独立的空间。这一修改导致加速效率的标准t新力通过产生一个更好的低维数据,最终帮助可视化乌尔都语手写字符和数字。此外,这个维度数据降低美联储CNN模型识别的目的。结果产生非常类似于我们以前的工作中,我们都使用text-images的尺寸。唯一的区别是我们的方法所表现出的时间效率,花了12 CPU秒比我们之前的工作(Husnain et al。27]),CPU消耗12分钟产生的混淆矩阵。因此,可以得出结论,使分类的任务/识别的高维数据,最好申请一个合适的降维方法,将显示数据的真实表示。然后,这个低维数据插入任何机器学习分类器进行测试/培训执行识别/分类任务。我们提出的限制t新力的算法只能用于嵌入或融合的数据来自两个或三个独立的空间。推广更多的独立空间几乎是不可能的,因为计算时间增加而计算两两之间的距离高维数据实例。
我们所知,一个非常有限的工作是观察到的手写文字识别领域的人物等级,以及这种不可用的数据集。我们的结果是手写文本的举措对分类在乌尔都语脚本的人物等级,和可能会有一些缺乏质量和全面性。我们未来的工作将包括最近的趋势和解决这些问题在我们当前的工作。
此外,我们还创建了一个先进的数据集包含乌尔都语手写字符和数字;我们所知,没有这样的公开数据集可用。现有的数据集的乌尔都语手写文本主要包括乌尔都语手写的单词和句子。使用这些现有数据集不能被有效地用于识别的乌尔都语的文本字符的水平。我们还提出了一个比较分析的结果,通过不同的方法提出基于参数优化的建议。也得出结论,深层网络可以帮助执行手写文本的识别和分类任务草书的最小时间。此外,我们的方法也有助于研究人员提供一个平台开发的应用程序和开发人员为孩子们学习如何写乌尔都语(和其他的语言)字符和数字准确性更高。正如前面所提到的,还有一个不足的一些标准数据存储库乌尔都语域生成和比较基准测试结果。为了填补这一缺口,我们正在生成和扩展我们的数据集,将发表公开在不久的将来。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者声明没有潜在的利益冲突。
确认
本研究支持的中国Petroleum-Beijing大学和基础研究基金批准号下的中央大学2462020 yjrc001。