移动信息系统

在这一页上

文摘介绍材料和方法结果讨论结论数据可用性的利益冲突确认引用版权相关文章

特殊的问题

移动应用测试新方法

把这个特殊的问题

研究文章|开放获取

体积2021年| 文章的ID7211419| https://doi.org/10.1155/2021/7211419

检测触摸乌尔都语盲文字符使用机器学习技术

Sana Shokat,¹ 早春作物Riaz ,¹ Sanam Shahla Rizvi ,² 拉特 ,³ 和Anand保罗 ⁴

学术编辑器: 中国杨

收到了 09年9月2021年

修改后的 2021年10月23日

接受 2021年11月20日

发表 2021年12月27日

文摘

技术革命改变了视障人容易读和写盲文。学习盲文在本土语言可以更方便用户。本研究提出了一种改进的后端处理算法较早开发触摸盲文文本输入的应用程序。这个应用程序是用来收集乌尔都语盲文数据,然后转换成乌尔都语的文本。盲文文本转换对印地语,阿拉伯语,孟加拉语,汉语,英语和其他语言。在这项研究中,乌尔都语盲文1级数据收集与多级(39乌尔都语用类的字符1,首字母(ﺍ)类39,Bri耶(ے)。(总N= 144)为每个类收集病例。收集的数据集是视障学生从全国特殊教育学校。视力受损的用户进入乌尔都语盲文字母使用触摸屏设备。最后数据集包含(N= 5638)。重建独立分量分析(黎加)的特征提取是乌尔都语为盲文创建文本分类模型。多级被分为三组(13),即,c一个tegory-1 (1–13), Alif-Zaal (ﺫ - ﺍ), category-2 (14–26), Ray-Fay (ﻒ - ﺮ), and category-3 (27–39), Kaaf-Bri Yay (ے - ﻕ), to give better vision and understanding. The performance was evaluated in terms of true positive rate, true negative rate, positive predictive value, negative predictive value, false positive rate, total accuracy, and area under the receiver operating curve. Among all the classifiers, support vector machine has achieved the highest performance with a 99.73% accuracy. For comparisons, robust machine learning techniques, such as support vector machine, decision tree, andK最近的邻居。目前,这个工作已经完成只1级乌尔都语盲文。在未来,我们打算加强这项工作使用2级乌尔都语与文本和语音反馈触摸盲文android手机。

1。介绍

智能设备是最强大的工具有视觉障碍的改善人民生活水平(1]。最近的趋势预测智能手机用户的急剧增加,预计增加90亿到2021年(2,3]。有各种各样的应用程序旨在帮助视力受损的用户,如屏幕阅读器,声音和语音输出设备,位置查找器,可穿戴设备移动性,音响系统,建立和虚拟助理(4- - - - - -7]。使用智能手机的快速增长改变了学习态度的人(8]。人们越来越多地转向技术探索新想法。人们通过观看视频学习,教程,在线课程的智能设备(9]。盲文是一种常用的语言对视力受损的人。路易斯·布莱叶1821年设计的。盲文是由六个点两列的形式和三排10]。视力受损的人写在表的帮助下手写笔和读通过滑动手指点。视力受损的人很难写盲文使用这些设备。一些接口教科书转换成盲文书,但是这个工具仅限于特定的语言;没有过程乌尔都语的文本转换成盲文(11]。以前,视力受损的人只会用手机打电话和发送和接收短信12]。但是现在,有视觉障碍的人们可以阅读盲文的帮助下一个不同的屏幕阅读器软件像苹果的画外音(13]。不同的应用,如NavTap,盲文玩(14],盲文利用[15),盲文键,TypeIn盲文(16],Perkinput [17],盲文容易[18],Eyedroid [19],DRISHYAM [20.)是为了便于盲文使用智能文本输入设备。尽管音频反馈在这些应用程序为用户提供援助,他们还使用了大量的手势很难记住和花了更多的时间来执行特定的任务。由于可用性问题,视力受损的用户无法访问该应用程序。研究过程中耗时少,更有用的应用程序。盲文自然语言转换,图像处理技术应用于扫描盲文表。布莱叶已经转换成阿拉伯语(21)、英语(22],孟加拉[23],印地语[24),泰米尔语、数学(25- - - - - -27],Odia [28使用这些技术,分别。盲文转化为确定性图灵机乌尔都语和印地语(29日)和图像分割算法(30.]。

此前,布莱叶被翻译成其他语言使用扫描表作为输入。转换忙碌是由于广泛的写在表的用户。几个触摸屏应用程序提供语音转换方法,帮助视力受损的人阅读和写作。大多数这些应用程序用户负担(31日,32),如记忆很多手势,找到点在屏幕上的位置,没有编辑选项。position-free盲文文本输入方法提出了解决这些问题。该应用程序的目的是将用户的至少负担而进入英语盲文字母。视力受损的用户可以点击任何地方输入盲文字符在屏幕上,随后保存在一个图像格式。对于字符识别,深入学习技术与GoogLeNet初始模型精度达到95%以上(33]。根据我们所知,很少有研究乌尔都语盲文数据,而没有一个需要用户输入直接从触摸屏。所以,有一种强烈的需要一个应用程序,该应用程序需要运行时盲文数据并将其转换为自然语言。目前,没有任何机制供盲文乌尔都语转换使用触摸屏设备。因此,在这项研究中,提出的前端接口萨那等人被用来收集数据集乌尔都语盲文。盲文输入保存为图像格式在以前版本的应用程序。在这里,一些后台处理算法改进,乌尔都语盲文输入保存在数值数据。机器学习技术,如DT、支持向量机和资讯与RICA-based特征提取方法用于盲文乌尔都语转换新乌尔都语盲文数据集,见图1。

本研究的主要贡献如下:(一)收藏的乌尔都语盲文1级数据集使用应用程序开发的萨那等人从视障学生的特殊教育学校,海豹打捞器Payyan,巴基斯坦(33]。没有现有的乌尔都语盲文数据集是直接取自触摸屏设备。(b)增强在萨那的后端处理机制等人提出了。(c)预测的乌尔都语从盲文字符输入是由强大的机器学习技术,如决策树(DT)、支持向量机(SVM)和K最近的邻居(资讯),使用RICA-based特征提取方法。(d)建议的评估机制收集乌尔都语数据集是基于真阳性率(TPR),真阴性率(TNR),阳性预测值(PPV),阴性预测值(NPV),假阳性率(玻璃钢),总精度(TA),曲线下面积(AUC)。(e)使用扫描为数据比较分析与以往的研究不同的国家和地区语言已经完成。

本研究包括以下部分:部分2提供材料和方法,收集有关数据信息,其过程。节3,这项研究的结果发表在细节。提供了讨论部分4,最后,给出了结论和未来的工作5。

2。材料和方法

2.1。数据集

前端android应用程序提出的乌尔都语数据集被用来收集本研究[33]。在基于android系统的触摸屏,视力受损的用户输入乌尔都语盲文字符。收集的数据集从全国特殊教育学校中心(NSEC)“海豹打捞器Payyan。“参与者的年龄是12到19年,和这些学生要么是完全或部分失明。在这个级别,乌尔都语1级盲文数据收集,其中包括39个不同的字符。

最终数据集包含5637乌尔都语盲文字符收集使用一个基于android系统的触摸屏设备。机器学习技术是利用转换盲文乌尔都语的文本使用这个数据集。所有的数据被淘汰后手动检查对每个字母的值。

2.2。后端处理机制

在这项研究中提出了一种改进的后端处理机制。在工作前,图像对应于每个字符组成的数据集使用。

在当前的研究中使用position-free接口、价值观的“x”和“y对每个点”协调是存储在数据库中。盲文是由six-dot模式和每个盲文字符是由这些点的激活和失活。例如,如果一个盲文字符有两个活跃点,该系统将保存的价值”x”和“y“活跃的坐标点,剩下的四个活动的点将被分配一个“0”值。初始数据存储在. txt文件的形式由逗号分隔。为了避免歧义的数据集,研究人员手动检查数据集,提取逗号被移除,每个点是存储在一个. csv文件。数据2(一个)和2 (b)显示视障用户进入木豆“ﺪ”和Toynﻄ使用触摸盲文接口。

(一)

(b)

盲文输入坐标提取的算法如图3。

由于活跃的唯一坐标位置点是保存在每个字符的数据集,而不是整个图像,因此,这种方法降低了存储需求。在以前的计划,单一图像保存在数据库4到8 KB大小。多个实例,这些需求得到乘以数量的情况下,与新方法,而一个文本文件包含144种不同的样本一个字符只花了9到10 KB的空间。

2.2.1。特征提取

不同的特征提取技术是早期预测盲文应用于文本转换为其他语言。Jha和Parvathi提取猪功能使用盲文印地语文本转换(24]。同样,李等人使用传统的特征提取方法使用资讯,朴素贝叶斯,等等,盲文字符的识别(34]。此外,李等人使用面向的柱状图的梯度(猪)和SVM盲文字符转换成英语,僧伽罗语,Odia [35,36]。本研究提取使用DT RICA-based特性,支持向量机,资讯转换盲文乌尔都语的文本分类器。该特征提取方法提取更多的功能比实际的输入数据集的维度。这个算法也有能力更快执行预处理步骤。

2.2.2。黎加特征提取方法

重建独立分量分析(黎加)不是一个监督学习技术,所以它不利用类标签信息。黎加算法介绍了ICA算法的局限性。这种技术比ICA交付更有前途的结果。近年来很多算法已经提出学习稀疏特性。

稀疏的过滤器可以区分很多人工和自然的信号,和这个特性在不同的机器学习技术起着至关重要的作用。

无标号数据作为输入

计算独立组件,标准ICA的优化问题(37)可以在数学上定义为在哪里代表了一种非线性罚函数, 是一个矩阵,l代表向量数,我定义单位矩阵。此外, 用来防止向量在吗X退化。为此,可以使用一个光滑的罚函数,也就是说, (27]。

然而,一些约束与正规化阻止标准独立分量分析学习overcomplete基础上。因此,缺陷,正如上面提到的,可以防止ICA扩展到高维数据。因此,在ICA正规化约束的替代,柔软的重建成本是用于黎加。替换之后,可以使用下面的无约束问题来表示黎加过滤:

在上述方程,λ> 0展品稀疏重建错误率之间的权衡。执行交换正规化约束后重建成本,这样,即使在unwhitened数据,黎加可以学习当稀疏表示Xovercomplete。然而,惩罚h可以产生稀疏表示和不是不变的38]。因此,黎加(39]交换额外池点球由L2,同时促进池功能集群相关的特性。此外,专题学习,L2池也鼓励稀疏。L2池(40,41)代表一个两层网络;第一层是平方非线性,在2层,非线性、平方根

池矩阵H∈P(l×l),H_k表示连续的池矩阵权重设置为常数,即1对矩阵中每一个元素H,element-wise乘法的定义 ,和ε> 0是一个小的常数。黎加是一个线性的方法,调查了稀疏表示只有在实际的数据空间。黎加方法无法使用类标签之间的联系信息和训练样本。

2.3。分类

流程分类类根据提取的特征被称为分类。有不同的机器学习技术,如监督、非监督,强化,合奏,神经网络,深度学习42]。机器学习方法(如DT、资讯和SVM基于RICA-based申请字符特征提取方法的预测。70% - -30%[数据用于训练和验证目的43]。

2.3.1。决策树

DT是一个机器学习技术,用于预测。DT是受欢迎的,因为它不需要太多的计算(44]。DT分类器有一个树状结构,将数据集划分为若干个子集。这个分类器训练模型采用简单的决策规则训练数据(45]。该模型用于预测所需的值,读取数据集和分类成类(8]。

下面的方程可以用来设计DT算法数学。

在这项研究中,训练和测试数据划分,-30%比70%。训练数据被用来建立一个模型,测试数据用于检验模型的有效性。多类的方法是用来预测盲文使用DT乌尔都语的文本。DT是调谐使用缺省参数。

2.3.2。然而,

然而是最常见和简单的非参数技术用于机器学习中回归和分类模型。欧氏距离公式(46是用来计算样本之间的距离。在哪里一个和b代表样本的数量。在哪里一个_我−b_我是我^th维度特征维度的样本n代表特征维度的总数。

最近的邻居的数量决定了输出值在使用资讯。如果该值的K= 1,对象可以划分并分配给单一的最近邻类(45]。

在这里,然而,使用盲文乌尔都语的文本进行分类。K选择= 3,距离度量欧几里得距离,距离体重相等的重量。

2.3.3。支持向量机

模式和字符识别中,支持向量机是最著名的机器学习分类方法。支持向量机是一种监督机器学习技术用于生物医学图像处理、计算机视觉、语音识别等。47]。支持向量机建立一个超平面在高维空间中获得一个更好的分类。如果实现了超平面的功能优势,最高分类器将良好的性能(48]。幅度越大,广义误差的风险越低。SVM发现超平面,它提供了最重要的训练数据的最小距离。支持向量机可以产生更一般的结果。支持向量机是一个双重的分类器,将数据转换成一个超平面,取决于高维数据。

让我们考虑一个超平面x。+b= 0,是正常的。

线性可分的数据表示如下: 在哪里y_我是双重的类标签。

当我们获得最大的利润最大化,目标函数值

E=║║²给了

从上面的方程的差异,现在我们有

如果数据不能线性分离,那么Ξ松弛变量我用于识别错误分类。

因此,在这种情况下,定义为一个目标函数受

在这里,C和l分别代表hyperparameters和成本函数。成本函数是用来检测离群值。双重配方,l(Ξ我)=Ξ我是受

在这里,

内核技巧是用来处理非线性可分的数据(49]。从输入空间的非线性映射函数转化为高维特征空间。多项式,高斯径向基函数是最受欢迎的内核。

SVM多项式内核:

SVM高斯多项式内核:

支持向量机良好的高斯内核:

显示为双重非线性的形成情况受

网格搜索是著名的评价指标用于支持向量机评价。精心挑选最优参数通过设置网格范围和步长。只有一个参数,“c“软优势不变,用于线性内核,而高斯核支持向量机和支持向量机好高斯内核包含两个训练参数,成本”c“σ,可以用来控制的非线性程度。黎加特征提取法研究中有70%的数据进行训练和测试为30%。在这项研究中,一个多项式内核所使用的缺省参数。

2.4。绩效评价指标

预测乌尔都语盲文字符,真阳性率(TPR),真阴性率(TNR),阳性预测值(PPV),阴性预测值(NPV),假阳性率(玻璃钢),和总精度(TA)是用来评估乌尔都语盲文字符的预测。

2.4.1。真阳性率

TPR也被称为灵敏度或召回。TPR表明有多少正确的字母被归类为真正的。在数学上,它是写成

2.4.2。真阴性率

TNR也称为特异性。这个度量定义的阴性预测值的数量被正确识别。它可以用数学表达

2.4.3。阳性预测值

一个测试预测真阳性时积极的结果。在数学上,它可以表示为

2.4.4。消极的预测价值

NPV显示测试结果在消极的预测,也有一个负值。给出了数学表示如下:

2.4.5。总精度

总精度的定义是通过添加所有真阳性和真正的底片,除以所有真正的底片,假阳性,真阳性和假阴性。

2.4.6。中华民国

这措施的比例所有真阳性和真正的底片。他们是通过绘制ROC曲线计算真阳性和假阳性值。TPR绘制沿x设在,而玻璃钢是绘制的y设在。曲线下的面积(AUC)值在0和1之间。一个值> 0.5显示分离。一个值大于0.5意味着分离。在这项研究中,盲文乌尔都语字符,即预测真正属于真正的类时,值1或接近1。

3所示。结果

乌尔都语盲文字符预计新从触摸屏设备收集的数据集。性能计算使用黎加特征提取方法和机器学习算法如DT,资讯,支持向量机。TPR、TNR PPV NPV,助教,玻璃钢,和AUC是性能指标的评估。

数据4(一)- - - - - -4 (c)显示使用DT AUC值一级(类1班13),Alif-Zaal(ﺫ-ﺍ),第二类(类14-class 26), Ray-Fay(ﻒ-ﺮ),3级(类27-class 39),分别Qaaf-Bri耶(ے-ﻕ)。通过提取黎加特性,性能达到最高一级(类1班13),Alif-Zaal(ﺫ-ﺍ),助教盲文类6 99.9%和0.9979 AUC值,如图4(一)。其次是首字母等其它类,海湾,干草,名叫凯和(ﺍ、ﺏﺡ,ﺥ)产生的精度(99.90%)、AUC(0.9995, 0.9914, 0.9895),分别。其他类,如伞形花耳草和Zaal(ذ،چ)也取得了更好的精度99.85%和97.76%的AUC(分别为0.9884和0.9887)。其他性能的措施,如TPR和TNR,产量表现(TPR > 94%)和(TNR > 98%)。从第二类()14日至26日,Ray-Fay(ﻒ-ﺮ)显示了最高性能类18日,21日,14日和15日即,Seen, Zuuad, Ray, Rray, Fay, Toyn, and Ghaen (ﺲ,, ﺾ ﺮ, ڑ, ﻒ ﻃ, ﻍ) with accuracies of (99.95%, 99.95%, 99.85%, 99.85%, 99.80%, 99.64%, and 99.64%), with AUC (0.9899, 0.9997, 0.9992, 0.9495, 0.9615, 0.9495, and 0.9683, respectively) with TPR >90% and TNR >99%, as shown in Figure4 (b)。3级(27-39)、Qaaf-Bri耶(ےﻕ),达到100%的最大TA类35(高尔Hy), 37(哈姆萨),28 (Kaaf)(ﻩ、ءﻙ)的AUC值(0.9553、1、0.9995)。这些结果随后Gaaf Meem, Hy(گ,ﻡﻫ)助教的(99.75%,99.85%,99.75%)(AUC值(0.0732,0.8125,和0.9553)的TPR > 94%,和TNR > 99%,除了类31日。TPR = 62.50%,如图4 (c)。中,最高的分离(AUC = 1)是乌尔都语看到盲文字符高尔Hy,哈姆萨(ﻩء)。AUC值等其他乌尔都语盲文字符的首字母,海湾,工资,和泰(ﺍ,ﺐ、پﺖ)99%以上指示好分类。详细的结果展示在表1。

(一)

(b)

(c)

获得的最大精度使用资讯类别(1-13)Alif-Zaal(ﺫ-ﺍ),是二班,4,5,和13。,Bay, Tay, Ttay, and Zaal (ﺏ, ﺖ, ٹ, ﺬ) with TA (99.95%, 99.85%, 99.80%, and 99.75%) and AUC (0.9997, 0.9992, 0.9990, and 0.9896, respectively), as shown in Figure5(一个)。第二类(14日至26日),(Ray-Fay)(ﻒ-ﺮ),助教最高100%的实现类的15日,18日和23日,紧随其后的是26日,21日,14日和19日。,Rray和Zoyn(ڑ、ﺲﻅ)。费伊和Zuad(ﻒﺾ)达到099.95%的助教,而雷和辛(ﺮﺵ)助教的99.90%和99.75%,分别与AUC(1, 1, 1, 0.9884, 0.9922, 0.9995,和0.9800)TPR > 96%, TNR > 99%,如图5 (b)。同样,最高TA达到3级(27-39),(Qaaf-Bri叶)(ے-ﻕ),上课是35岁,37岁,31日,30日,27日和28日,即。,Gol Hy, Hamza, Meem, Laam, Qaaf, and Kaaf (ﻩ, ء, ﻡ, ﻞ,, ﻕ ﻙ) (99.75%, 99.80%, 100%, 100%, 99.69%, and 99.69%), with AUC (1, 1, 0.7143, 0.9457, 0.9873, and 0.9578, respectively) along with TPR >42% for Meem (ﻡ), TPR = 100% for Gol Hy (ﻩ), Hamza (ء), and TNR = 100% for Gol Hy, Hamza, and Meem (ﻩ, ء, ﻡ), as shown in Figure5 (c)。整体的发现表明盲文字符如ڑﺲ,ﻅ,ﻩ,ءAUC值最高的1显示100%分离在所有类。

(一)

(b)

(c)

我们也达到了0.99以上AUC几个乌尔都语盲文字符如ﺍﺏ,پ,ﺖ,等等,通过使用资讯提取的特性集,然而也表现出不错的效果,使用黎加特性提取盲文字符从触摸屏设备。表2显示了所有详细的DT结果1级乌尔都语盲文字符。

此外,支持向量机是用来测量性能。类别(1-13)Alif-Zaal(ﺫ-ﺍ),显示了类的精度最高,6,9日,8日,3、4和7,即。,Jeem, Tay, Pay, Chy, Hay, Ssay, and Khay (ﺥ,ﺙ,ﺡ,چ,پ,ﺖ,ﺝ) are with TA (100%, 99.95%, 99.95%, 99.90%, 99.60%, 99.60%, and 99.80%), with AUC (1, 0.9997, 0.9997, 0.9995, 0.9995, 0.9995, and 0.9990, respectively) with TPR = 100% and TNR >99%, as shown in Figure6(一)。第二类(14日至26日),(Ray-Fay)(ﻒ-ﺮ),最高性能实现类26日,15日,23日,25日,14日,19日和21日,即。,Ghaen, Ray, Fay, Rray, Zoyn, Sheen, and Zuad (ﻍ, ﺮ, ﻒ, ڑ, ﻅ, ﺵ, ﺾ) with TA achieved (100%, 99.95%, 99.90%, 99.90%, 99.85%, 99.85%, and 99.85%) and AUC (1, 0.9444, 0.9828, 0.9905, 0.9992, 0.9900, and 0.9776, respectively), as shown in Figure6 (b)。同样,3级(Qaaf-Bri叶)(ے-ﻕ),最高TA实现类34、35、36.37,38岁,28日,30日,33岁。,Waao, Hy, Gol Ha, Hamza, Choti Yeh (ﻮ, ﻫ, ﻩ, ء, ﻯ) all achieved highest TA of (100%), with AUC (1) with TPR = 100% and TNR = 100%.

(一)

(b)

(c)

然而,Kaaf Laam,中午Gunnah(ﻙ、ﻞں)获得99.95%的助教;AUC Kaaf和Laam是中午的0.9997和0.9889 Gunnah TPR 97%, TNR > 99%,如图6 (c)。支持向量机优于其他分类器,如前所述,AUC值。盲文字符,如ﺥﻒ、ﻮﻩ,ﻫ,ء,ﻯAUC值最高的1。SVM显示了ﺍ99%分离、ﺏپ,ﺖ,ٹ,ﺙ,چ,ﺫ,ﺮ,ﺰ,ﻕﻙ,ﻞ。数据7(一)- - - - - -7 (c)说明总体性能在所有乌尔都语字母表从Alif-Bri耶通过测量公关,TNR, PPV, NPV, TNR,助教,AUC。

(一)

(b)

(c)

结果Shokat et al。33)报道,朴素贝叶斯,DT,资讯,支持向量机,连续模型,和GoogLeNet初始模型有助教(96.38%)、(97.20%)(97.04%),(83.00%),(92.21%),和(95.8%),分别为。朴素贝叶斯、DT PPV和资讯,TPR,没有显示出巨大的价值。更好的结果被认为与支持向量机、连续模型,GoogLeNet初始模型。最大错误率最低的性能是通过SVM RICA-based特征提取方法和TPR (93.96%)、TNR (99.85%)、PPV (94.51%)、NPV(99.87%),助教(99.73%)、玻璃钢(0.14%)。使用DT SVM之后,结果显示第二个最佳性能。获得的结果显示TPR (90.98%)、TNR (99.78%)、PPV (92.21%)、NPV(99.78%),助教(99.57%),和玻璃钢(0.21%)。最后,性能通过使用资讯TPR (90.2%)、TNR (99.72%)、PPV (89.75%)、NPV(99.77%),助教(99.5%),和玻璃钢(0.28%)。表3比较萨那等人的发现与当前的研究(33]。更有前途的结果取得了一种改进的后端处理系统数据收集;我们总共取得了更有前途的结果准确性和空间使用。

4所示。讨论

为视觉挑战人提高生活质量,盲文必须转换为自然语言。盲文自然语言转换在许多研究已经完成。大多数研究扫描盲文文档翻译成标准的英语或相反。Jha和Parvathi进行了一项研究,使用支持向量机分类器训练使用面向梯度的直方图进行特征提取(猪)特征提取方法手写Odia和印地语的文本翻译成盲文。转换Odia [36和印地语25)使用这个分类技术,精度都达到99%和94.5%,分别为盲文。使用相同的技术,精度达到了99%和80%将手写的英语和僧伽罗语的文件转换成盲文文本(35]。一个支持向量机分类器训练哈尔特征提取方法用于手写英语转换表,不到10%的分类错误(50]。英语盲文的转换发生了从一个基于手势的触摸屏输入使用资讯分类。两个点之间的距离计算使用贝叶斯触摸的距离,产生了一个97.4%的准确率(51]。另一项研究进行了识别扫描盲文字符使用资讯,朴素贝叶斯、随机森林,和SVM描绘,63%,53%,65%,和69.6%精度达到34),如表所示4。

盲文乌尔都语字符识别,RICA-based特征提取,和健壮的DT等机器学习算法,支持向量机,使用资讯。乌尔都语盲文的新数据集收集从视障学生使用新建触摸盲文自由输入的应用程序。主要发现为DT算法实现一级(1-13)Alif-Zaal(ﺫ-ﺍ),最高的检测性能得到与盲文类6(ﺙ)助教(99.95%)和AUC (0.9979)。这些结果是紧随其后的是其他类等(ﺍ、ﺏﺡ,ﺥ)产生的精度(99.90%),与AUC(0.9995, 0.9995, 0.9914和0.9895),分别。其他性能指标,如TPR TNR,显示性能(TPR > 94%)和(TNR > 98%)。同样,第二类()14日至26日,雷费伊(ﻒ-ﺮ),对DT显示了类18的最佳效果,21日14日和15日即,看到Zuuad射线和Rray(ﺲ、ﺾﺮ,ڑ)精度为99.95%,99.95%,99.85%。和99.85%,AUC(分别为0.9899,0.9997,0.9992和0.9495)和TPR = 100%, TNR > 99%。3级(27-39),Qaaf-Bri叶(ے-ﻕ),最高TA实现类35岁,37岁和28。高尔Hy,哈姆萨(ﻩء)(100%)助教。助教Kaaf是99.90%,AUC(1、1和0.9995),分别用TPR > 94%, TNR > 99%。采用资讯,TA达到最高的类别(1-13)Alif-Zaal(ﺫ-ﺍ),是为13类,2和4,也就是说。湾和泰(ﺐﺖ)(99.85%和99.85%),AUC(分别为0.9997和0.9992)。第二类(14日至26日),(Ry-Fy)(ﻒ-ﺮ),最高TA实现类15日,18日,23日,26日和21日,即。, Rray, Seen, and Zoyn (ڑ, ﺲ, ﻅ) TA = 100% followed by Fay and Zuad (ﻒ, ﺾ) with TPR (99.95%) with AUC (1, 1, 1, 0.9884, and 0.9922) with TPR = 100% and TNR >99%. Similarly, for category-3 (27–39) (Qaaf-Bri Yeh) (ے - ﻕ), highest TA was achieved for class 35, 37, and 31, i.e., Gol Ha, Hamza, and Meem (ﻩ, ء, ﻡ) TA (100%, 100%, and 99.80%), with AUC (1, 1, and 0.7143) with TPR >42% for Meem (ﻡ) and TPR = 100% for Gol Hy (ﻩ) and Hamza (ء) and TNR = 100% for Hay, Hamza, and Meem (,ء,ﻩ ﻡ). Moreover, performance evaluation for SVM category (1–13), Alif-Zaal (ﺫ - ﺍ), shows highest accuracies for class 10, 6, 9, and 8, i.e., Khay, Ssay, Hay, and Chy (ﺥ, ﺙ, ﺡ, چ) with TA (100%, 99.95%, 99.95%, and 99.90%), with AUC (1, 0.9997, 0.9997, and 0.9995, respectively) with TPR = 100% and TNR >99%. For category-2 (14–26) (Ray-Fay) (ﻒ - ﺮ), highest performance was achieved for class 26, 15, 23, and 25, i.e., Fay, Rray, Zoyn, and Ghaen (ﻒ ڑ, ﻍ, ﻅ) with TA achieved (100%, 99.95%, 99.90%, and 99.90%) with AUC (1, 0.9444, 0.9828, and 0.9905). Similarly, for category-3 (Qaaf-Bri Yeh) (ے - ﻕ), the highest TA is achieved for class 34, 35, 36.37, and 38, i.e., Waao, Hy, Gol Hay, Hamza, and Choti Yeh (ﻮ, ﻫ, ﻩ, ء, ﻯ) all achieved the highest TA of (100%), with AUC (1) with TPR = 100% and TNR = 100%.

5。结论和未来的工作

盲文的人日益增长的通讯手段视觉障碍。超过1.5亿人继续使用盲文全世界有几个原因。识字是一个强大的情况下显示盲文学习如何阅读和写作的重要性。随着科技的进步,盲人和视力受损的用户更容易。各种研究进行了盲文转化为自然语言。然而,大多数研究使用手写扫描表盲文转化为自然语言,如阿拉伯语、印地语、泰米尔语、Odia,中国,韩国,孟加拉语,英语,和古吉拉特语,反之亦然(21,28,36,52- - - - - -57]。根据我们的知识的乌尔都语盲文识别,没有这样的研究已经发现到目前为止。在本研究中,乌尔都语使用触摸盲文数据集收集android应用程序(33]。这个应用程序易于使用,减少繁重的视力受损的人。强大的机器学习技术包括支持向量机与多项式内核,DT使用默认参数,和资讯K= 3的乌尔都语盲文字符识别。数据集分为训练和验证70% - -30%。性能指标用于评估这些分类器的性能是PPV, NPV,玻璃钢,FNR,玻璃钢,助教,和AUC。RICA-based特征提取方法用于乌尔都语盲文字符识别。最高性能使用DT分类器显示类35,高尔Hy(ﻩ)和类37岁的哈姆萨(ء),取得了最大分离AUC(1)与助教,TPR, TNR = 100%,玻璃钢= 0%。同样,最高的性能使用资讯显示类15日,18日,23日,35岁和37。,Rray, Seen, Zoyn, Gol Hy, and Hamza (ڑ, ﺲ, ﻅ, ﻩ, ء) attained the highest separation AUC (1) with TPR, TNR, TA = 100%, and FPR = 0%. Furthermore, using SVM, the highest performance was achieved by class 10, 26, 34, 35, 36, 37, and 38, i.e., Khay, Fay, Waao, Hy, Gol Hy, Hamza, and Choti Yeh (ﺥ, ﻒ, ﻮ, ﺡ, ﻩ, ء, ﻯ) with highest separation AUC (1) with TPR, TNR, TA = 100%, and FPR = 0%. SVM has the highest TA of all classifiers with TA (99.73%), TPR (93.96%), TNR (99.85%), PPV (94.51%), NPV (99.87%), and FPR (0.14%).

黎加特性提取和健壮的机器学习技术用于识别乌尔都语盲文字符。我们打算扩大在未来这个数据集,包括其他语言,如英语和数学与盲文先进水平。性能将会被评估使用卷积神经网络(CNN)和转移学习技术,如GoogleNet初始模型和LSTM。通过实现这些模型,系统的性能将进一步改善。除了这一点,我们将更加专注于提供错误检测和声音为视力受损的用户反馈服务。

数据可用性

这个数据集不是公开的。但它可以根据要求提供。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

这项研究工作受到了韩国国家研究基金会(NRF)由韩国政府拨款资助下参考号码(2020 r1a2c1012196)。

引用

y李和j·李,”一个清单评估盲人用户的可用性教育的智能手机应用程序,“在信息社会普及,18卷,不。2、343 - 360年,2019页。
视图: 出版商的网站 | 谷歌学术搜索
Tech.代表,“爱立信移动报告”,2019。https://www.ericsson.com/en/mobility - report/reports/november - 2019。
s . O 'Dea”智能手机用户2020 | Statista,“全球智能手机用户2016 - 2021。2020年。2020年https://www.statista.com/statistics/330695/number-of-smartphone-users-worldwide-。
w . Grusseneyer和大肠Folmer访问触摸屏技术为视觉障碍患者:一项调查,“ACM反式。访问。第一版。,9卷,不。2日至31日,2017页。
视图: 谷歌学术搜索
s . Akram马哈茂德,即Ullah et al .,”建设和分析小说可穿戴辅助装置一个视力受损的人,”应用仿生学和生物力学卷,2020篇文章ID 6153128, 11页,2020年。
视图: 出版商的网站 | 谷歌学术搜索
a . a . Diaz-toro s e . Campana-bastidas, e . f . Caicedo-bravo”应用系统协助盲人漫步未知环境在一个安全的方式,”杂志上的传感器卷,2021篇文章ID 6685686, 18页,2021年。
视图: 出版商的网站 | 谷歌学术搜索
诉艾耶k .沙、美国Sheth和k . Devadkar“视障的虚拟助手”学报2020年第五届国际会议上沟通和电子系统(icc)2020年12月,印度哥印拜陀。
视图: 出版商的网站 | 谷歌学术搜索
k·泰勒和l .银世界各地的智能手机的拥有量正在迅速增加,但并不总是一样的美国皮尤研究中心,华盛顿特区,2019年,https://Www.Pewresearch.Org/Global/2019/02/05/Smartphone-Ownership-Is-Growing-Rapidly-Around-the-World-But-Not-Always-Equally/。
s . Shokat r . Riaz来说,s . s . Rizvi k .汗f . Riaz来说,和s . j . Kwon“盲文文本转换方法的分析和评价,“移动信息系统ID 3461651条,卷。2020年,13页,2020。
视图: 出版商的网站 | 谷歌学术搜索
j . Rantala r . Raisamo j . Lylykangas et al .,”方法提供盲文字符在一个移动设备上带有触摸屏和触觉反馈,”IEEE触觉,卷2,不。1,28-39,2009页。
视图: 出版商的网站 | 谷歌学术搜索
r·k·Virinchi”系统的设计与分析阅读盲文与远程云架构,”IEEE学报》17日印度委员会国际会议(INDICON)2020年9月,新德里,印度。
视图: 出版商的网站 | 谷歌学术搜索
b . Leporini m . c .布吉和m .布吉,“通过画外音与移动设备交互,”24日澳大利亚人机交互会议程序on-OzCHI”122012年5月,墨尔本,澳大利亚,。
视图: 出版商的网站 | 谷歌学术搜索
m . m . Li风扇,k . n . Truong“BrailleSketch,”19 ACM SIGACCESS国际会议的程序在电脑上和可访问性美国巴尔的摩,毫升,2017年6月。
视图: 出版商的网站 | 谷歌学术搜索
t . Guerreiro, p .小湖,p .桑塔纳,d . Goncalves和j·豪尔赫,“NavTap BrailleTap:非视觉短信接口,”《北美康复工程和辅助技术协会会议(Resna)美国巴尔的摩,毫升,2008年1月。
视图: 谷歌学术搜索
j·奥利维拉,t . Guerreiro h·尼克洛j .豪尔赫和d . Goncalves”BrailleType:释放盲文在触摸屏手机,”美国联合会人机交互会议上2011年12月,里斯本,葡萄牙,。
视图: 出版商的网站 | 谷歌学术搜索
n s Subash s Nambiar,诉Kumar“BrailleKey:另一个盲文文本输入系统:比较研究的一个创新简化视障,文本输入系统”诉讼的第四届国际会议在智能人机交互:推进科技为人类IHCI 2012,Kharagpur,印度,2012年6月。
视图: 出版商的网站 | 谷歌学术搜索
s . Azenkot j . o . Wobbrock s Prasain和r·e·拉”输入手指检测其非触摸屏Perkinput文本输入,”图形界面的程序加拿大多伦多安大略,2012年5月。
视图: 谷歌学术搜索
b .Šepića Ghanem,沃格尔,“BrailleEasy:智能手机单手盲文键盘,”研究卫生技术和信息卷,217年,第1035 - 1030页,2015年。
视图: 谷歌学术搜索
m . Shabnam s·戈文达拉扬,“手势识别算法:braille-coded触摸屏手势模式:eyedroid,”印度j .科学。抛光工艺。,9卷,不。33岁的1卷,2016页。
视图: 出版商的网站 | 谷歌学术搜索
h . Gautam和p .白肢野牛DRISHYAM_实时文本盲文的转换和实现,”IEEE学报》17日印度委员会国际会议(INDICON)2020年5月,新德里,印度。
视图: 谷歌学术搜索
s . d . Al-Shamma和美国Fathi”,阿拉伯语盲文识别和转录成文本和声音,”2010年第五届开罗国际生物医学工程研讨会论文集开罗,埃及,2010年6月。
视图: 出版商的网站 | 谷歌学术搜索
p·r·库马尔“盲文语言转换器对视力受损的人来说,“Int。j .理解力。放置Eng >,第一版。》第六卷,没有。2、2229 - 2232年,2018页。
视图: 谷歌学术搜索
l . Nahar a Jaafar,艾哈迈德·e·a . b . m . a . Kaish“盲文学习申请视障学生的设计在孟加拉国,”辅助技术,27卷,不。3、172 - 182年,2015页。
视图: 出版商的网站 | 谷歌学术搜索
诉Jha和k . Parvathi盲文音译的印地语手写文本使用机器学习进行字符识别,”Int。j .科学。抛光工艺。研究,8卷,不。10日,1188 - 1193年,2019页。
视图: 谷歌学术搜索
a .棺材和z Sroczyński”,基于规则的智能系统意见卡数学符号,“多媒体工具和应用程序,卷78,不。19日,28089 - 28110年,2019页。
视图: 出版商的网站 | 谷歌学术搜索
m . Maćkowski p . Brzoza m .Żabka, d . Spinczyk对数学“多媒体平台”互动学习访问的盲人,多媒体工具和应用程序,卷77,不。5,6191 - 6208年,2018页。
视图: 谷歌学术搜索
公元前j . Yook k金的儿子,和美国公园,“翻译程序可用性分析的替代多媒体数学材料为盲人,“Multimed。工具:。施普林格,柏林,德国,2020年。
视图: 出版商的网站 | 谷歌学术搜索
s . Padmavathi k . s . s . Manojna, s . s . Reddy“盲文的转换文本在英语,印地语和泰米尔语语言,“国际计算机科学,工程和应用程序,3卷,不。3,19-32,2013页。
视图: 出版商的网站 | 谷歌学术搜索
m·A·Fahiem“确定性图灵机的上下文敏感的翻译盲文乌尔都语的文本编码,”组合图像分析海德堡,施普林格,柏林,2008年。
视图: 谷歌学术搜索
美国乞讨,k . Parvathi,诉Jha”文本扫描印地语翻译文档通过图像处理、盲文”印度科学和技术杂志》上,10卷,不。33岁,1 - 8,2017页。
视图: 出版商的网站 | 谷歌学术搜索
g . Kouroupetroglou A皮诺,p .里加“方法论的方法设计和开发基于web的库存移动辅助技术应用,”多媒体工具和应用程序,卷76,不。4、5347 - 5366年,2017页。
视图: 出版商的网站 | 谷歌学术搜索
s . Priyadarsini p .特、k . Nayak和s . Champati”在印度语言语音合成技术的一项调查显示,“多媒体系统26卷,第468 - 453页,2020年。
视图: 谷歌学术搜索
s . Shokat r . Riaz来说,s . s . Rizvi a . m . Abbasi和s . j . Kwon“深度学习方案charcater预测与position-free触摸在屏幕上设置的盲文输入法,“以人类为中心的计算和信息科学,10卷,不。1 - 24,2020页。
视图: 谷歌学术搜索
t·李,曾庆红x,徐,“深学习盲文识别方法,”《2014年国际会议上计算情报和通信网络2014年11月,印度博帕尔。
视图: 出版商的网站 | 谷歌学术搜索
w . k . i l·i·佩雷拉和t . d . s . h .认定的“面向光学盲文识别基于直方图的梯度特征和支持向量机,”国际工程科学杂志》上,8卷,不。10日,19192 - 19195年,2018页。
视图: 谷歌学术搜索
诉Jha和k . Parvathi”基于机器学习盲文Odia语言的音译,“国际创新技术和探索工程杂志》上,9卷,不。5,1866 - 1871年,2020页。
视图: 谷歌学术搜索
y y Yanhui小朱z .新品系,姚明赵,y Yunchao魏、和美国Shikui魏、内核重建ICA对稀疏表示,“IEEE神经网络和学习系统,26卷,不。6日,页。1222 - 1232年,2015年6月。
视图: 出版商的网站 | 谷歌学术搜索
a . Hyvarinen j . Hurri p·o·霍耶,自然图像统计,激飞伦敦,伦敦,英国,2009年。
问:勒,a . Karpenko j . Ngiam, a . y . Ng”ICA与重建成本高效学习overcomplete特性,”先进的神经信息处理系统施普林格,柏林,德国,2011年。
视图: 谷歌学术搜索
杨绍明。关铭Boureau、j·庞塞和y LeCun(“特征池在视觉识别的理论分析”学报》第27届国际会议上机器学习(ICML-10)2010年9月,以色列海法。
视图: 谷歌学术搜索
y勒存”、“学习层次结构不变的特性,“在学习层次结构不变的特性,”欧洲计算机视觉的诉讼2012年6月,柏林,海德堡,。
视图: 谷歌学术搜索
k·m·胡w . Li Yan, z,胡锦涛和h”为单变量隧道沉降预测现代机器学习技术:比较研究,“数学问题在工程卷,2019篇文章ID 7057612, 12页,2019。
视图: 出版商的网站 | 谷歌学术搜索
拉希德,诉Gupta, h .河岸和c·库马尔”乌尔都语文本分类:使用机器学习技术,比较研究”学报2018年十三数字信息管理国际会议(ICDIM)2018年5月,印度哥印拜陀。
视图: 出版商的网站 | 谷歌学术搜索
t . Shaikhina d·劳s数据d·布里格斯r·希金斯和n . Khovanova“决策树和随机森林模型预测结果抗体不兼容的肾移植,”生物医学信号处理和控制52卷,第462 - 456页,2019年。
视图: 出版商的网站 | 谷歌学术搜索
l·侯赛因中情局Awan, w·阿齐兹et al .,“检测提取充血性心力衰竭的多通道的特性和使用机器学习技术,”生物医学研究的国际卷,2020篇文章ID 4281243, 19页,2020。
视图: 出版商的网站 | 谷歌学术搜索
Ning, z马、赵x”dForml(资讯)-PseAAC:检测甲酰化网站使用再从蛋白质序列算法和伪组件通过周5步规则,”理论生物学杂志》上卷。470年,43-49,2019页。
视图: 出版商的网站 | 谷歌学术搜索
a . Gammerman诉Vovk、h·博斯特罗姆和l .,“保形和概率预测与应用程序:编辑”,机器学习,卷108,不。3、379 - 380年,2019页。
视图: 出版商的网站 | 谷歌学术搜索
m . Achirul南达,k米堡研讨会,d . Nandika和A . Maddu”比较研究支持向量机的核函数及其应用对白蚁检测”信息,9卷,不。1、p。5、2018。
视图: 出版商的网站 | 谷歌学术搜索
a . Tharwat”参数的调查与核函数支持向量机分类器,”知识和信息系统,卷61,不。3、1269 - 1302年,2019页。
视图: 出版商的网站 | 谷歌学术搜索
张x j . Li Yan, d,“光学盲文识别haar小波的特征和支持向量机”《国际会议上计算机、机电一体化、控制和电子工程2010年12月,长春,中国,。
视图: 出版商的网站 | 谷歌学术搜索
h . Udapola和s . r . Liyanage盲文信使:基于自适应学习的非视觉触摸屏输入为盲人使用盲文社区,”《国际会议在Info-Business和技术创新,2017年Ozo科伦坡,斯里兰卡,2018年10月。
视图: 谷歌学术搜索
杨x, y, h·刘,y钱,“Chinese-braille翻译盲文语料库的基础上,国际先进的普遍的和无处不在的计算》杂志上,8卷,不。2,56 - 63,2016页。
视图: 出版商的网站 | 谷歌学术搜索
x, j .钟j . Cai h . Liu和y .钱,“CBConv:服务自动转换的汉字与精度高、盲文”21国际ACM SIGACCESS会议的程序在电脑上和可访问性美国,纽约,纽约,2019年4月。
视图: 出版商的网站 | 谷歌学术搜索
s . s . Lee Jung,和h的歌,“CNN-based药物识别和盲文压花机系统为盲人,“计算科学与工程杂志》上,12卷,不。4、149 - 156年,2018页。
视图: 出版商的网站 | 谷歌学术搜索
t·r·Abir t·s·本·艾哈迈德·m·t·拉赫曼和s . Jafreen手写的孟加拉语字符识别盲文模式转换使用图像处理和机器学习BRAC大学达卡,孟加拉国,2018年。
m . Gadag诉Udayashankara,“英语盲文文本转换,有效的方法”国际先进研究期刊》的研究在电子、电子、仪表工程,5卷,不。4、3343 - 3348年,2016页。
视图: 谷歌学术搜索
h·帕尔克美国沙、f·帕特尔和h . Vyas以及“古吉拉特语盲文文字识别:一个评论,”国际计算机科学与通信》杂志上,7卷,不。1,19到24,2019页。
视图: 谷歌学术搜索

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

783年

下载

625年

引用