文摘

技术革命改变了视障人容易读和写盲文。学习盲文在本土语言可以更方便用户。本研究提出了一种改进的后端处理算法较早开发触摸盲文文本输入的应用程序。这个应用程序是用来收集乌尔都语盲文数据,然后转换成乌尔都语的文本。盲文文本转换对印地语,阿拉伯语,孟加拉语,汉语,英语和其他语言。在这项研究中,乌尔都语盲文1级数据收集与多级(39乌尔都语用类的字符1,首字母(ﺍ)类39,Bri耶(ے)。(总N= 144)为每个类收集病例。收集的数据集是视障学生从全国特殊教育学校。视力受损的用户进入乌尔都语盲文字母使用触摸屏设备。最后数据集包含(N= 5638)。重建独立分量分析(黎加)的特征提取是乌尔都语为盲文创建文本分类模型。多级被分为三组(13),即,c一个tegory-1 (1–13), Alif-Zaal (ﺫ - ﺍ), category-2 (14–26), Ray-Fay (ﻒ - ﺮ), and category-3 (27–39), Kaaf-Bri Yay (ے - ﻕ), to give better vision and understanding. The performance was evaluated in terms of true positive rate, true negative rate, positive predictive value, negative predictive value, false positive rate, total accuracy, and area under the receiver operating curve. Among all the classifiers, support vector machine has achieved the highest performance with a 99.73% accuracy. For comparisons, robust machine learning techniques, such as support vector machine, decision tree, andK最近的邻居。目前,这个工作已经完成只1级乌尔都语盲文。在未来,我们打算加强这项工作使用2级乌尔都语与文本和语音反馈触摸盲文android手机。

1。介绍

智能设备是最强大的工具有视觉障碍的改善人民生活水平(1]。最近的趋势预测智能手机用户的急剧增加,预计增加90亿到2021年(2,3]。有各种各样的应用程序旨在帮助视力受损的用户,如屏幕阅读器,声音和语音输出设备,位置查找器,可穿戴设备移动性,音响系统,建立和虚拟助理(4- - - - - -7]。使用智能手机的快速增长改变了学习态度的人(8]。人们越来越多地转向技术探索新想法。人们通过观看视频学习,教程,在线课程的智能设备(9]。盲文是一种常用的语言对视力受损的人。路易斯·布莱叶1821年设计的。盲文是由六个点两列的形式和三排10]。视力受损的人写在表的帮助下手写笔和读通过滑动手指点。视力受损的人很难写盲文使用这些设备。一些接口教科书转换成盲文书,但是这个工具仅限于特定的语言;没有过程乌尔都语的文本转换成盲文(11]。以前,视力受损的人只会用手机打电话和发送和接收短信12]。但是现在,有视觉障碍的人们可以阅读盲文的帮助下一个不同的屏幕阅读器软件像苹果的画外音(13]。不同的应用,如NavTap,盲文玩(14],盲文利用[15),盲文键,TypeIn盲文(16],Perkinput [17],盲文容易[18],Eyedroid [19],DRISHYAM [20.)是为了便于盲文使用智能文本输入设备。尽管音频反馈在这些应用程序为用户提供援助,他们还使用了大量的手势很难记住和花了更多的时间来执行特定的任务。由于可用性问题,视力受损的用户无法访问该应用程序。研究过程中耗时少,更有用的应用程序。盲文自然语言转换,图像处理技术应用于扫描盲文表。布莱叶已经转换成阿拉伯语(21)、英语(22],孟加拉[23],印地语[24),泰米尔语、数学(25- - - - - -27],Odia [28使用这些技术,分别。盲文转化为确定性图灵机乌尔都语和印地语(29日)和图像分割算法(30.]。

此前,布莱叶被翻译成其他语言使用扫描表作为输入。转换忙碌是由于广泛的写在表的用户。几个触摸屏应用程序提供语音转换方法,帮助视力受损的人阅读和写作。大多数这些应用程序用户负担(31日,32),如记忆很多手势,找到点在屏幕上的位置,没有编辑选项。position-free盲文文本输入方法提出了解决这些问题。该应用程序的目的是将用户的至少负担而进入英语盲文字母。视力受损的用户可以点击任何地方输入盲文字符在屏幕上,随后保存在一个图像格式。对于字符识别,深入学习技术与GoogLeNet初始模型精度达到95%以上(33]。根据我们所知,很少有研究乌尔都语盲文数据,而没有一个需要用户输入直接从触摸屏。所以,有一种强烈的需要一个应用程序,该应用程序需要运行时盲文数据并将其转换为自然语言。目前,没有任何机制供盲文乌尔都语转换使用触摸屏设备。因此,在这项研究中,提出的前端接口萨那等人被用来收集数据集乌尔都语盲文。盲文输入保存为图像格式在以前版本的应用程序。在这里,一些后台处理算法改进,乌尔都语盲文输入保存在数值数据。机器学习技术,如DT、支持向量机和资讯与RICA-based特征提取方法用于盲文乌尔都语转换新乌尔都语盲文数据集,见图1

本研究的主要贡献如下:(一)收藏的乌尔都语盲文1级数据集使用应用程序开发的萨那等人从视障学生的特殊教育学校,海豹打捞器Payyan,巴基斯坦(33]。没有现有的乌尔都语盲文数据集是直接取自触摸屏设备。(b)增强在萨那的后端处理机制等人提出了。(c)预测的乌尔都语从盲文字符输入是由强大的机器学习技术,如决策树(DT)、支持向量机(SVM)和K最近的邻居(资讯),使用RICA-based特征提取方法。(d)建议的评估机制收集乌尔都语数据集是基于真阳性率(TPR),真阴性率(TNR),阳性预测值(PPV),阴性预测值(NPV),假阳性率(玻璃钢),总精度(TA),曲线下面积(AUC)。(e)使用扫描为数据比较分析与以往的研究不同的国家和地区语言已经完成。

本研究包括以下部分:部分2提供材料和方法,收集有关数据信息,其过程。节3,这项研究的结果发表在细节。提供了讨论部分4,最后,给出了结论和未来的工作5

2。材料和方法

2.1。数据集

前端android应用程序提出的乌尔都语数据集被用来收集本研究[33]。在基于android系统的触摸屏,视力受损的用户输入乌尔都语盲文字符。收集的数据集从全国特殊教育学校中心(NSEC)“海豹打捞器Payyan。“参与者的年龄是12到19年,和这些学生要么是完全或部分失明。在这个级别,乌尔都语1级盲文数据收集,其中包括39个不同的字符。

最终数据集包含5637乌尔都语盲文字符收集使用一个基于android系统的触摸屏设备。机器学习技术是利用转换盲文乌尔都语的文本使用这个数据集。所有的数据被淘汰后手动检查对每个字母的值。

2.2。后端处理机制

在这项研究中提出了一种改进的后端处理机制。在工作前,图像对应于每个字符组成的数据集使用。

在当前的研究中使用position-free接口、价值观的“x”和“y对每个点”协调是存储在数据库中。盲文是由six-dot模式和每个盲文字符是由这些点的激活和失活。例如,如果一个盲文字符有两个活跃点,该系统将保存的价值”x”和“y“活跃的坐标点,剩下的四个活动的点将被分配一个“0”值。初始数据存储在. txt文件的形式由逗号分隔。为了避免歧义的数据集,研究人员手动检查数据集,提取逗号被移除,每个点是存储在一个. csv文件。数据2(一个)2 (b)显示视障用户进入木豆“ﺪ”和Toynﻄ使用触摸盲文接口。

盲文输入坐标提取的算法如图3

由于活跃的唯一坐标位置点是保存在每个字符的数据集,而不是整个图像,因此,这种方法降低了存储需求。在以前的计划,单一图像保存在数据库4到8 KB大小。多个实例,这些需求得到乘以数量的情况下,与新方法,而一个文本文件包含144种不同的样本一个字符只花了9到10 KB的空间。

2.2.1。特征提取

不同的特征提取技术是早期预测盲文应用于文本转换为其他语言。Jha和Parvathi提取猪功能使用盲文印地语文本转换(24]。同样,李等人使用传统的特征提取方法使用资讯,朴素贝叶斯,等等,盲文字符的识别(34]。此外,李等人使用面向的柱状图的梯度(猪)和SVM盲文字符转换成英语,僧伽罗语,Odia [35,36]。本研究提取使用DT RICA-based特性,支持向量机,资讯转换盲文乌尔都语的文本分类器。该特征提取方法提取更多的功能比实际的输入数据集的维度。这个算法也有能力更快执行预处理步骤。

2.2.2。黎加特征提取方法

重建独立分量分析(黎加)不是一个监督学习技术,所以它不利用类标签信息。黎加算法介绍了ICA算法的局限性。这种技术比ICA交付更有前途的结果。近年来很多算法已经提出学习稀疏特性。

稀疏的过滤器可以区分很多人工和自然的信号,和这个特性在不同的机器学习技术起着至关重要的作用。

无标号数据作为输入

计算独立组件,标准ICA的优化问题(37)可以在数学上定义为 在哪里 代表了一种非线性罚函数, 是一个矩阵,l代表向量数,定义单位矩阵。此外, 用来防止向量在吗X退化。为此,可以使用一个光滑的罚函数,也就是说, (27]。

然而,一些约束与正规化阻止标准独立分量分析学习overcomplete基础上。因此,缺陷,正如上面提到的,可以防止ICA扩展到高维数据。因此,在ICA正规化约束的替代,柔软的重建成本是用于黎加。替换之后,可以使用下面的无约束问题来表示黎加过滤:

在上述方程,λ> 0展品稀疏重建错误率之间的权衡。执行交换正规化约束后重建成本,这样,即使在unwhitened数据,黎加可以学习当稀疏表示Xovercomplete。然而,惩罚h可以产生稀疏表示和不是不变的38]。因此,黎加(39]交换额外池点球由L2,同时促进池功能集群相关的特性。此外,专题学习,L2池也鼓励稀疏。L2池(40,41)代表一个两层网络;第一层是 平方非线性,在2层, 非线性、平方根

池矩阵H∈P(l×l),Hk表示连续的池矩阵权重设置为常数,即1对矩阵中每一个元素H,element-wise乘法的定义 ,ε> 0是一个小的常数。黎加是一个线性的方法,调查了稀疏表示只有在实际的数据空间。黎加方法无法使用类标签之间的联系信息和训练样本。

2.3。分类

流程分类类根据提取的特征被称为分类。有不同的机器学习技术,如监督、非监督,强化,合奏,神经网络,深度学习42]。机器学习方法(如DT、资讯和SVM基于RICA-based申请字符特征提取方法的预测。70% - -30%[数据用于训练和验证目的43]。

2.3.1。决策树

DT是一个机器学习技术,用于预测。DT是受欢迎的,因为它不需要太多的计算(44]。DT分类器有一个树状结构,将数据集划分为若干个子集。这个分类器训练模型采用简单的决策规则训练数据(45]。该模型用于预测所需的值,读取数据集和分类成类(8]。

下面的方程可以用来设计DT算法数学。

在这项研究中,训练和测试数据划分,-30%比70%。训练数据被用来建立一个模型,测试数据用于检验模型的有效性。多类的方法是用来预测盲文使用DT乌尔都语的文本。DT是调谐使用缺省参数。

2.3.2。然而,

然而是最常见和简单的非参数技术用于机器学习中回归和分类模型。欧氏距离公式(46是用来计算样本之间的距离。 在哪里一个b代表样本的数量。 在哪里一个bth维度特征维度的样本n代表特征维度的总数。

最近的邻居的数量决定了输出值在使用资讯。如果该值的K= 1,对象可以划分并分配给单一的最近邻类(45]。

在这里,然而,使用盲文乌尔都语的文本进行分类。K选择= 3,距离度量欧几里得距离,距离体重相等的重量。

2.3.3。支持向量机

模式和字符识别中,支持向量机是最著名的机器学习分类方法。支持向量机是一种监督机器学习技术用于生物医学图像处理、计算机视觉、语音识别等。47]。支持向量机建立一个超平面在高维空间中获得一个更好的分类。如果实现了超平面的功能优势,最高分类器将良好的性能(48]。幅度越大,广义误差的风险越低。SVM发现超平面,它提供了最重要的训练数据的最小距离。支持向量机可以产生更一般的结果。支持向量机是一个双重的分类器,将数据转换成一个超平面,取决于高维数据。

让我们考虑一个超平面x +b= 0, 是正常的。

线性可分的数据表示如下: 在哪里y是双重的类标签。

当我们获得最大的利润最大化,目标函数值

E=║ 2给了

从上面的方程的差异,现在我们有

如果数据不能线性分离,那么Ξ松弛变量用于识别错误分类。

因此,在这种情况下,定义为一个目标函数

在这里,Cl分别代表hyperparameters和成本函数。成本函数是用来检测离群值。双重配方,l)=Ξ

在这里,

内核技巧是用来处理非线性可分的数据(49]。从输入空间的非线性映射函数转化为高维特征空间。多项式,高斯径向基函数是最受欢迎的内核。

SVM多项式内核:

SVM高斯多项式内核:

支持向量机良好的高斯内核:

显示为双重非线性的形成情况

网格搜索是著名的评价指标用于支持向量机评价。精心挑选最优参数通过设置网格范围和步长。只有一个参数,“c“软优势不变,用于线性内核,而高斯核支持向量机和支持向量机好高斯内核包含两个训练参数,成本”c“σ,可以用来控制的非线性程度。黎加特征提取法研究中有70%的数据进行训练和测试为30%。在这项研究中,一个多项式内核所使用的缺省参数。

2.4。绩效评价指标

预测乌尔都语盲文字符,真阳性率(TPR),真阴性率(TNR),阳性预测值(PPV),阴性预测值(NPV),假阳性率(玻璃钢),和总精度(TA)是用来评估乌尔都语盲文字符的预测。

2.4.1。真阳性率

TPR也被称为灵敏度或召回。TPR表明有多少正确的字母被归类为真正的。在数学上,它是写成

2.4.2。真阴性率

TNR也称为特异性。这个度量定义的阴性预测值的数量被正确识别。它可以用数学表达

2.4.3。阳性预测值

一个测试预测真阳性时积极的结果。在数学上,它可以表示为

2.4.4。消极的预测价值

NPV显示测试结果在消极的预测,也有一个负值。给出了数学表示如下:

2.4.5。总精度

总精度的定义是通过添加所有真阳性和真正的底片,除以所有真正的底片,假阳性,真阳性和假阴性。

2.4.6。中华民国

这措施的比例所有真阳性和真正的底片。他们是通过绘制ROC曲线计算真阳性和假阳性值。TPR绘制沿x设在,而玻璃钢是绘制的y设在。曲线下的面积(AUC)值在0和1之间。一个值> 0.5显示分离。一个值大于0.5意味着分离。在这项研究中,盲文乌尔都语字符,即预测真正属于真正的类时,值1或接近1。

3所示。结果

乌尔都语盲文字符预计新从触摸屏设备收集的数据集。性能计算使用黎加特征提取方法和机器学习算法如DT,资讯,支持向量机。TPR、TNR PPV NPV,助教,玻璃钢,和AUC是性能指标的评估。

数据4(一)- - - - - -4 (c)显示使用DT AUC值一级(类1班13),Alif-Zaal(ﺫ-ﺍ),第二类(类14-class 26), Ray-Fay(ﻒ-ﺮ),3级(类27-class 39),分别Qaaf-Bri耶(ے-ﻕ)。通过提取黎加特性,性能达到最高一级(类1班13),Alif-Zaal(ﺫ-ﺍ),助教盲文类6 99.9%和0.9979 AUC值,如图4(一)。其次是首字母等其它类,海湾,干草,名叫凯和(ﺍ、ﺏﺡ,ﺥ)产生的精度(99.90%)、AUC(0.9995, 0.9914, 0.9895),分别。其他类,如伞形花耳草和Zaal(ذ،چ)也取得了更好的精度99.85%和97.76%的AUC(分别为0.9884和0.9887)。其他性能的措施,如TPR和TNR,产量表现(TPR > 94%)和(TNR > 98%)。从第二类()14日至26日,Ray-Fay(ﻒ-ﺮ)显示了最高性能类18日,21日,14日和15日即,Seen, Zuuad, Ray, Rray, Fay, Toyn, and Ghaen (ﺲ,, ﺾ ﺮ, ڑ, ﻒ ﻃ, ﻍ) with accuracies of (99.95%, 99.95%, 99.85%, 99.85%, 99.80%, 99.64%, and 99.64%), with AUC (0.9899, 0.9997, 0.9992, 0.9495, 0.9615, 0.9495, and 0.9683, respectively) with TPR >90% and TNR >99%, as shown in Figure4 (b)。3级(27-39)、Qaaf-Bri耶(ےﻕ),达到100%的最大TA类35(高尔Hy), 37(哈姆萨),28 (Kaaf)(ﻩ、ءﻙ)的AUC值(0.9553、1、0.9995)。这些结果随后Gaaf Meem, Hy(گ,ﻡﻫ)助教的(99.75%,99.85%,99.75%)(AUC值(0.0732,0.8125,和0.9553)的TPR > 94%,和TNR > 99%,除了类31日。TPR = 62.50%,如图4 (c)。中,最高的分离(AUC = 1)是乌尔都语看到盲文字符高尔Hy,哈姆萨(ﻩء)。AUC值等其他乌尔都语盲文字符的首字母,海湾,工资,和泰(ﺍ,ﺐ、پﺖ)99%以上指示好分类。详细的结果展示在表1

获得的最大精度使用资讯类别(1-13)Alif-Zaal(ﺫ-ﺍ),是二班,4,5,和13。,Bay, Tay, Ttay, and Zaal (ﺏ, ﺖ, ٹ, ﺬ) with TA (99.95%, 99.85%, 99.80%, and 99.75%) and AUC (0.9997, 0.9992, 0.9990, and 0.9896, respectively), as shown in Figure5(一个)。第二类(14日至26日),(Ray-Fay)(ﻒ-ﺮ),助教最高100%的实现类的15日,18日和23日,紧随其后的是26日,21日,14日和19日。,Rray和Zoyn(ڑ、ﺲﻅ)。费伊和Zuad(ﻒﺾ)达到099.95%的助教,而雷和辛(ﺮﺵ)助教的99.90%和99.75%,分别与AUC(1, 1, 1, 0.9884, 0.9922, 0.9995,和0.9800)TPR > 96%, TNR > 99%,如图5 (b)。同样,最高TA达到3级(27-39),(Qaaf-Bri叶)(ے-ﻕ),上课是35岁,37岁,31日,30日,27日和28日,即。,Gol Hy, Hamza, Meem, Laam, Qaaf, and Kaaf (ﻩ, ء, ﻡ, ﻞ,, ﻕ ﻙ) (99.75%, 99.80%, 100%, 100%, 99.69%, and 99.69%), with AUC (1, 1, 0.7143, 0.9457, 0.9873, and 0.9578, respectively) along with TPR >42% for Meem (ﻡ), TPR = 100% for Gol Hy (ﻩ), Hamza (ء), and TNR = 100% for Gol Hy, Hamza, and Meem (ﻩ, ء, ﻡ), as shown in Figure5 (c)。整体的发现表明盲文字符如ڑﺲ,ﻅ,ﻩ,ءAUC值最高的1显示100%分离在所有类。

我们也达到了0.99以上AUC几个乌尔都语盲文字符如ﺍﺏ,پ,ﺖ,等等,通过使用资讯提取的特性集,然而也表现出不错的效果,使用黎加特性提取盲文字符从触摸屏设备。表2显示了所有详细的DT结果1级乌尔都语盲文字符。

此外,支持向量机是用来测量性能。类别(1-13)Alif-Zaal(ﺫ-ﺍ),显示了类的精度最高,6,9日,8日,3、4和7,即。,Jeem, Tay, Pay, Chy, Hay, Ssay, and Khay (ﺥ,ﺙ,ﺡ,چ,پ,ﺖ,ﺝ) are with TA (100%, 99.95%, 99.95%, 99.90%, 99.60%, 99.60%, and 99.80%), with AUC (1, 0.9997, 0.9997, 0.9995, 0.9995, 0.9995, and 0.9990, respectively) with TPR = 100% and TNR >99%, as shown in Figure6(一)。第二类(14日至26日),(Ray-Fay)(ﻒ-ﺮ),最高性能实现类26日,15日,23日,25日,14日,19日和21日,即。,Ghaen, Ray, Fay, Rray, Zoyn, Sheen, and Zuad (ﻍ, ﺮ, ﻒ, ڑ, ﻅ, ﺵ, ﺾ) with TA achieved (100%, 99.95%, 99.90%, 99.90%, 99.85%, 99.85%, and 99.85%) and AUC (1, 0.9444, 0.9828, 0.9905, 0.9992, 0.9900, and 0.9776, respectively), as shown in Figure6 (b)。同样,3级(Qaaf-Bri叶)(ے-ﻕ),最高TA实现类34、35、36.37,38岁,28日,30日,33岁。,Waao, Hy, Gol Ha, Hamza, Choti Yeh (ﻮ, ﻫ, ﻩ, ء, ﻯ) all achieved highest TA of (100%), with AUC (1) with TPR = 100% and TNR = 100%.

然而,Kaaf Laam,中午Gunnah(ﻙ、ﻞں)获得99.95%的助教;AUC Kaaf和Laam是中午的0.9997和0.9889 Gunnah TPR 97%, TNR > 99%,如图6 (c)。支持向量机优于其他分类器,如前所述,AUC值。盲文字符,如ﺥﻒ、ﻮﻩ,ﻫ,ء,ﻯAUC值最高的1。SVM显示了ﺍ99%分离、ﺏپ,ﺖ,ٹ,ﺙ,چ,ﺫ,ﺮ,ﺰ,ﻕﻙ,ﻞ。数据7(一)- - - - - -7 (c)说明总体性能在所有乌尔都语字母表从Alif-Bri耶通过测量公关,TNR, PPV, NPV, TNR,助教,AUC。

结果Shokat et al。33)报道,朴素贝叶斯,DT,资讯,支持向量机,连续模型,和GoogLeNet初始模型有助教(96.38%)、(97.20%)(97.04%),(83.00%),(92.21%),和(95.8%),分别为。朴素贝叶斯、DT PPV和资讯,TPR,没有显示出巨大的价值。更好的结果被认为与支持向量机、连续模型,GoogLeNet初始模型。最大错误率最低的性能是通过SVM RICA-based特征提取方法和TPR (93.96%)、TNR (99.85%)、PPV (94.51%)、NPV(99.87%),助教(99.73%)、玻璃钢(0.14%)。使用DT SVM之后,结果显示第二个最佳性能。获得的结果显示TPR (90.98%)、TNR (99.78%)、PPV (92.21%)、NPV(99.78%),助教(99.57%),和玻璃钢(0.21%)。最后,性能通过使用资讯TPR (90.2%)、TNR (99.72%)、PPV (89.75%)、NPV(99.77%),助教(99.5%),和玻璃钢(0.28%)。表3比较萨那等人的发现与当前的研究(33]。更有前途的结果取得了一种改进的后端处理系统数据收集;我们总共取得了更有前途的结果准确性和空间使用。

4所示。讨论

为视觉挑战人提高生活质量,盲文必须转换为自然语言。盲文自然语言转换在许多研究已经完成。大多数研究扫描盲文文档翻译成标准的英语或相反。Jha和Parvathi进行了一项研究,使用支持向量机分类器训练使用面向梯度的直方图进行特征提取(猪)特征提取方法手写Odia和印地语的文本翻译成盲文。转换Odia [36和印地语25)使用这个分类技术,精度都达到99%和94.5%,分别为盲文。使用相同的技术,精度达到了99%和80%将手写的英语和僧伽罗语的文件转换成盲文文本(35]。一个支持向量机分类器训练哈尔特征提取方法用于手写英语转换表,不到10%的分类错误(50]。英语盲文的转换发生了从一个基于手势的触摸屏输入使用资讯分类。两个点之间的距离计算使用贝叶斯触摸的距离,产生了一个97.4%的准确率(51]。另一项研究进行了识别扫描盲文字符使用资讯,朴素贝叶斯、随机森林,和SVM描绘,63%,53%,65%,和69.6%精度达到34),如表所示4

盲文乌尔都语字符识别,RICA-based特征提取,和健壮的DT等机器学习算法,支持向量机,使用资讯。乌尔都语盲文的新数据集收集从视障学生使用新建触摸盲文自由输入的应用程序。主要发现为DT算法实现一级(1-13)Alif-Zaal(ﺫ-ﺍ),最高的检测性能得到与盲文类6(ﺙ)助教(99.95%)和AUC (0.9979)。这些结果是紧随其后的是其他类等(ﺍ、ﺏﺡ,ﺥ)产生的精度(99.90%),与AUC(0.9995, 0.9995, 0.9914和0.9895),分别。其他性能指标,如TPR TNR,显示性能(TPR > 94%)和(TNR > 98%)。同样,第二类()14日至26日,雷费伊(ﻒ-ﺮ),对DT显示了类18的最佳效果,21日14日和15日即,看到Zuuad射线和Rray(ﺲ、ﺾﺮ,ڑ)精度为99.95%,99.95%,99.85%。和99.85%,AUC(分别为0.9899,0.9997,0.9992和0.9495)和TPR = 100%, TNR > 99%。3级(27-39),Qaaf-Bri叶(ے-ﻕ),最高TA实现类35岁,37岁和28。高尔Hy,哈姆萨(ﻩء)(100%)助教。助教Kaaf是99.90%,AUC(1、1和0.9995),分别用TPR > 94%, TNR > 99%。采用资讯,TA达到最高的类别(1-13)Alif-Zaal(ﺫ-ﺍ),是为13类,2和4,也就是说。湾和泰(ﺐﺖ)(99.85%和99.85%),AUC(分别为0.9997和0.9992)。第二类(14日至26日),(Ry-Fy)(ﻒ-ﺮ),最高TA实现类15日,18日,23日,26日和21日,即。, Rray, Seen, and Zoyn (ڑ, ﺲ, ﻅ) TA = 100% followed by Fay and Zuad (ﻒ, ﺾ) with TPR (99.95%) with AUC (1, 1, 1, 0.9884, and 0.9922) with TPR = 100% and TNR >99%. Similarly, for category-3 (27–39) (Qaaf-Bri Yeh) (ے - ﻕ), highest TA was achieved for class 35, 37, and 31, i.e., Gol Ha, Hamza, and Meem (ﻩ, ء, ﻡ) TA (100%, 100%, and 99.80%), with AUC (1, 1, and 0.7143) with TPR >42% for Meem (ﻡ) and TPR = 100% for Gol Hy (ﻩ) and Hamza (ء) and TNR = 100% for Hay, Hamza, and Meem (,ء,ﻩ ﻡ). Moreover, performance evaluation for SVM category (1–13), Alif-Zaal (ﺫ - ﺍ), shows highest accuracies for class 10, 6, 9, and 8, i.e., Khay, Ssay, Hay, and Chy (ﺥ, ﺙ, ﺡ, چ) with TA (100%, 99.95%, 99.95%, and 99.90%), with AUC (1, 0.9997, 0.9997, and 0.9995, respectively) with TPR = 100% and TNR >99%. For category-2 (14–26) (Ray-Fay) (ﻒ - ﺮ), highest performance was achieved for class 26, 15, 23, and 25, i.e., Fay, Rray, Zoyn, and Ghaen (ﻒ ڑ, ﻍ, ﻅ) with TA achieved (100%, 99.95%, 99.90%, and 99.90%) with AUC (1, 0.9444, 0.9828, and 0.9905). Similarly, for category-3 (Qaaf-Bri Yeh) (ے - ﻕ), the highest TA is achieved for class 34, 35, 36.37, and 38, i.e., Waao, Hy, Gol Hay, Hamza, and Choti Yeh (ﻮ, ﻫ, ﻩ, ء, ﻯ) all achieved the highest TA of (100%), with AUC (1) with TPR = 100% and TNR = 100%.

5。结论和未来的工作

盲文的人日益增长的通讯手段视觉障碍。超过1.5亿人继续使用盲文全世界有几个原因。识字是一个强大的情况下显示盲文学习如何阅读和写作的重要性。随着科技的进步,盲人和视力受损的用户更容易。各种研究进行了盲文转化为自然语言。然而,大多数研究使用手写扫描表盲文转化为自然语言,如阿拉伯语、印地语、泰米尔语、Odia,中国,韩国,孟加拉语,英语,和古吉拉特语,反之亦然(21,28,36,52- - - - - -57]。根据我们的知识的乌尔都语盲文识别,没有这样的研究已经发现到目前为止。在本研究中,乌尔都语使用触摸盲文数据集收集android应用程序(33]。这个应用程序易于使用,减少繁重的视力受损的人。强大的机器学习技术包括支持向量机与多项式内核,DT使用默认参数,和资讯K= 3的乌尔都语盲文字符识别。数据集分为训练和验证70% - -30%。性能指标用于评估这些分类器的性能是PPV, NPV,玻璃钢,FNR,玻璃钢,助教,和AUC。RICA-based特征提取方法用于乌尔都语盲文字符识别。最高性能使用DT分类器显示类35,高尔Hy(ﻩ)和类37岁的哈姆萨(ء),取得了最大分离AUC(1)与助教,TPR, TNR = 100%,玻璃钢= 0%。同样,最高的性能使用资讯显示类15日,18日,23日,35岁和37。,Rray, Seen, Zoyn, Gol Hy, and Hamza (ڑ, ﺲ, ﻅ, ﻩ, ء) attained the highest separation AUC (1) with TPR, TNR, TA = 100%, and FPR = 0%. Furthermore, using SVM, the highest performance was achieved by class 10, 26, 34, 35, 36, 37, and 38, i.e., Khay, Fay, Waao, Hy, Gol Hy, Hamza, and Choti Yeh (ﺥ, ﻒ, ﻮ, ﺡ, ﻩ, ء, ﻯ) with highest separation AUC (1) with TPR, TNR, TA = 100%, and FPR = 0%. SVM has the highest TA of all classifiers with TA (99.73%), TPR (93.96%), TNR (99.85%), PPV (94.51%), NPV (99.87%), and FPR (0.14%).

黎加特性提取和健壮的机器学习技术用于识别乌尔都语盲文字符。我们打算扩大在未来这个数据集,包括其他语言,如英语和数学与盲文先进水平。性能将会被评估使用卷积神经网络(CNN)和转移学习技术,如GoogleNet初始模型和LSTM。通过实现这些模型,系统的性能将进一步改善。除了这一点,我们将更加专注于提供错误检测和声音为视力受损的用户反馈服务。

数据可用性

这个数据集不是公开的。但它可以根据要求提供。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

这项研究工作受到了韩国国家研究基金会(NRF)由韩国政府拨款资助下参考号码(2020 r1a2c1012196)。