研究文章|开放获取
雷雳雪高,Lianwen金, ”HCRCaaS:手写字符识别容器作为服务基于QoS保证算法”,科学的规划, 卷。2018年, 文章的ID6509275, 16 页面, 2018年。 https://doi.org/10.1155/2018/6509275
HCRCaaS:手写字符识别容器作为服务基于QoS保证算法
文摘
手写字符识别(HCR)是一个主流移动设备输入方法,吸引了很大的研究兴趣。虽然先前的研究给出了合理的识别精度,仍然很难直接将先进的HCR服务嵌入到移动设备软件和获得优秀但快速的结果。云计算是一种相对较新的网络计算资源提供者可以满足先进的弹性资源需求HCR服务高度认可的准确性。然而,由于延迟敏感字符识别服务,传统的云计算虚拟化技术的性能损失(例如,基于内核的虚拟机(KVM))可能会损害性能。此外,云计算的计算资源调度不当损害不仅性能,而且资源利用率。因此,HCR在线服务必须保证性能和提高资源利用率的HCR服务在云计算中。为了解决这些问题,在本文中,我们提出一个HCR容器作为服务(HCRCaaS)云计算。我们解决几个关键贡献:(1)设计一个HCR引擎的基础上深卷积神经网络作为一种先进的演示HCR引擎更好的识别精度,(2)提供一个孤立的轻量级运行时环境高性能和容易扩张,和(3)设计一个贪婪的资源调度算法基于绩效评估优化资源利用率的服务质量(QoS)保证。实验结果表明,系统不仅降低了性能损失与传统下云计算高级HCR算法相比也QoS保证下适当提高了资源利用率。本研究也为其他相关研究提供有价值的参考。
1。介绍
随着越来越多的移动设备(如智能手机、平板电脑和笔记本电脑),输入方法已经成为最重要的应用之一。因此,手写字符识别(HCR)技术,智能手机的主要输入方式之一,因而受到相当大的关注和研究质量改进(1,2]。然而,一些高级HCR算法很难嵌入到移动设备,因为他们的资源容量限制和时间复杂度的算法。此外,将定制HCR引擎嵌入到应用程序的资源和精力集中,限制先进HCR算法使用和研究的个体企业。现在,云计算(3,4)提供了一个创新的网络应用程序模型与超级计算资源能力。这提供了并行框架实现高性能和还支持跨平台客户端(5),让客户从本地设备的计算能力和资源的局限性。此外,云计算可以提供一个弹性分布式资源可以动态分配来满足不同的计算需求。因此,卸载HCR任务云计算是解决冲突的有效方式资源容量限制和HCR在移动设备上的时间复杂度。
然而,任务卸载到云计算也带来了新的挑战:使用使用率[6,7)模式来调整资源的大小根据不同的工作负载,这可能会导致损伤的的服务质量(QoS)和资源利用率8]。尤其是对延迟敏感的HCR任务,云计算的复杂度分布体系结构(例如,Hadoop和火花)是不够的。此外,云计算的关键技术(如计算资源虚拟化和资源调度)也影响性能的重要因素。
记住这些,在这里,我们提出一个HCR容器作为服务(HCRCaaS)基于QoS保障政策,这不仅提供了一个先进HCR算法(比如,一个深卷积神经网络(DCNN) [9])提供更好的识别精度,还降低了性能损失与容器技术对延迟敏感的要求。保证QoS以及资源利用率高,我们建议一个资源调度算法基于绩效评估资源调度下贪婪的政策。我们的主要贡献如下:(我)设计一个基于DCNNs HCR引擎作为高度认可的先进HCR算法的演示在云计算的准确性(2)使用容器部署服务以减少性能损失的虚拟化层,容易扩大不同工作负载下的资源(3)设计一个贪婪的基于绩效评价的资源调度算法为了提高QoS保证资源利用率
本文的其余部分组织如下:部分中描述的相关工作2。系统的整体架构的详细信息和通信体系结构提出了部分3。HCR引擎设计的描述,并给出了实验部分4。提出了部分的资源调度方法5。我们的实验设计和结果比传统系统介绍部分6节中,我们得出这样的结论7。
2。相关工作
一些新的机器学习系统提供云计算网络服务最近被引入。Triguero et al。10)开发了一种MapReduce-based架构分发功能,克服大型数据集分类的挑战。润湿et al。11)提出了一种新的体系结构,不同于DevOps构件模型的系统分类和部署应用程序拓扑。Kaceniauskas et al。12)开发云软件服务特定的计算分析血流通过主动脉瓣上私立大学云,虽然Anjum et al。13)设计了一个基于云的视频分析框架的可伸缩性和健壮的分析基于云计算的视频流。Verbelen et al。14)设计和评估图分区算法,软件组件分配给机器在云中。道等。15)提出了一个图像注释方案,移动图像压缩传输Hamming-compressed感应到云上。Tripathy和米塔尔16)设计并结合内核和可能性方法基于Hadoop的图像处理,而夏et al。17]介绍了一个基于Hadoop短期交通流预测系统还。鑫et al。18)提出了小说《自适应分布式极端学习机”为分布式计算使用MapReduce。同样,Zhang et al。19)提出了一个分布式算法训练元模型基于MapReduce。因此,任务卸载到一个云计算平台成为一个热门研究领域。到目前为止,这些提议系统没有提供适当的资源调度方法来提高资源利用率或保证QoS。
为了提高云计算的资源利用率,夏et al。20.)用排队模型来评估预期的要求完成时间和拒绝的概率一个系统。蒋介石et al。21)提出了一个高效的绿色控制算法基于三种排队模型。他们的工作的目的是找到合适的参数来降低功耗。杜et al。22)利用排队模型来分析云计算资源。这个模型优化视频在线服务的QoS为了减少队列长度和时间延迟。降低成本的混合云计算平台,李et al。23]提出减少沟通成本与在线动态提供算法基于排队模型。Khazaei et al。24)使用一个M / G / M / M + r排队模型来评估云计算网络服务的性能。在本研究的基础上,他们认为排队模型的服务器数量之间的关系并给出了输入缓冲区大小和他们可以获得重要的性能指标,包括任务阻塞概率和总等待时间发生在用户请求。Bi et al。25)视为一个云数据中心作为一个M / M / 1 / n /∞排队系统。Vakilinia et al。26)认为工作到达率遵循泊松过程,和工作的数量在系统可以建模为一个M / G / n / n排队系统。此外,Zhang et al。27)使用一个M / G / n排队模型的容器服务谷歌集群的过程。基于排队模型,研究人员评估了平均服务时间。曹et al。28建模一个多核服务器处理器和多服务器作为一个排队系统。基于该模型,他们提出了一个算法来优化核的速度。冯et al。29日)认为云计算市场多M / M / 1排队模型。Maguluri和Srikant30.)提出了一种优化作业调度算法来优化云计算服务的QoS和使用云服务的排队模型的过程。
基于这些作品,云计算服务的结构可以被看作是一个排队模型。尽管这些研究工作有助于提高QoS或云计算的资源利用率,有限制的方法,忽视了资源超额预定会影响服务的性能和资源利用率。这将创建一个巨大的差距实际执行行为和行为之间的最初的预期。
改善HCR准确性,传统方法包括修改后的二次判别函数(MQDF) [31日)和图形套索二次判别函数(GLQDF) [32)已经成功地用于提高识别精度。格雷厄姆DeepCNet使用(33]基于与良好的效果在ICDAR DCNNs 2013 (34),这是英超争夺文档分析和识别,和是中国的手写字符识别的竞争。自那以后,提出了不同的方法来提高字符识别中,例如,Murru和罗西尼35)提出了一个原始算法中初始化权值反向传播神经网络来提高字符识别培训,和陶等。36)提出了一种新的降维方法称为稀疏歧视信息保存(SDIP)汉字字体识别。王等人。37)提出了一个统一的框架来扩展短文本基于字嵌入集群和卷积神经网络(cnn)。钟等。38)提出了GoogLeNet模型来提高中国的手写字符识别精度。研究[39,40)还提出了DCNN-based模型获得手写字符识别精度高。这些以前的研究表明,DCNN-based模型可以实现更好的识别精度。基于这些作品,我们还提出了一个高级HCR引擎基于DCNN演示展示如何先进HCR云服务被设计为一个真正的项目。
正如上面提到的,虽然HCR传统的在线机器学习服务,有一些差异。首先,由于字符输入速度的要求,HCR服务是一个对延迟敏感的应用程序,它需要一个简单的系统架构。如前所述,HCR服务资源容量限制下表现不佳的移动设备。如何设计一个HCR服务在云计算中提供更高的性能是一个值得研究的问题。第二,HCR服务也是一个识别accuracy-sensitive应用程序。因此,如何设计一个HCR服务在云计算提供更好的识别精度是一个研究热点。我们设计一个HCR引擎基于DCNN模型来实现更好的识别精度。第三,由于移动设备的数量巨大,如何提高资源利用率在云计算还需要研究。基于排队模型,我们设计一个资源调度算法在性能评价和贪婪的政策。资源调度可以保证QoS以及资源利用率的提高。 To the best of our knowledge, this is the first work to address these three problems when designing a high-efficiency HCR service in a real cloud computing project.
3所示。系统设计
3.1。计划的手写字符识别容器作为服务
云计算使用虚拟化技术作为一个资源共享的方法为租户提供弹性和可配置的随需应变的资源。就像前面提到的1HCR是一种常见的应用程序在移动设备和资源需要满足对延迟敏感需求。此外,手写字符的数据由数据点,所以手写字符的大小和尺寸都很小(2]。因此,移动设备之间的数据传输延迟和云计算可以忽略。因此,识别过程的延迟成为影响性能的主要因素。
然而,虚拟机基于传统的虚拟化技术,例如,KVM, Xen, hyper - v,完整的虚拟化技术full-guest操作系统(OS)。他们导致如此高的性能损失,只有几个虚拟机(vm)可以创建从一个物理机(41]。根据(42创建一个VM),所需的时间是15秒,这使得资源调度落后工作负载的变化。
与虚拟机相比,容器不同的体系结构,软件部署和包装都是有用的工具在不同的配置环境。容器使用容器引擎而不是程序层来隔离可配置的资源环境。因此,容器可以直接运行物理机器的CPU线程(PM)没有一个虚拟化层,这通常被认为是一个轻量级虚拟化技术是减少资源消耗43,44]。IBM对虚拟机进行了性能测试和容器(43),实验表明,容器优于vm的CPU、内存和I / O性能。容器的启动时间是用毫秒表示而vm是用秒表示。此外,集装箱已经提出解决方案更多的可互操作的应用程序在云中包装(45]。因此,云计算的容器更适合HCR服务部署。
基于云计算的弹性服务架构(46),HCR容器作为服务(HCRCaaS)包括这些关键组件:(我)容器:容器是用于资源隔离和轻量级虚拟化运行环境配置HCR服务。(2)主机集群(资源池):集群中的每个点可以被视为容器主机,负责守护程序线程与容器引擎服务提供容器环境。下午还提供了资源,例如,CPU、内存和存储。提供资源调度管理、Python RabbitMQ客户端库(47)是运行听消息从资源管理服务器资源调度的需求。据消息,点创建或删除容器。(3)注册表容器图像存储:容器图像存储提供了服务器存储来存储容器的形象,因此,用户可以上传和下载从服务器容器形象。它是用来提供标准HCR容器模板的管理批处理弹性扩张。HCR引擎的基础上,我们设计一个标准集装箱图像基于Ubuntu操作系统从官方下载集装箱枢纽。HCR容器创建图像,docker-file用于构建配置环境中运行本文件并复制引擎。我们设置了autoexec引擎本文件的最后docker-file线。(iv)负载均衡服务器:负载均衡服务器进度数据从客户端设备容器建立并行计算。它的目的是提供使用Nginx 1.9 HCRCaaS的反向代理。提供一个传输控制协议(TCP)负载平衡,Nginx拥有流配置参数设置,和任务平衡政策是加权轮循。由于系统容器是相同的,重量值相等。与Python RabbitMQ服务器守护程序线程运行客户端库听的消息从资源管理服务器添加或删除容器从负载平衡配置。(v)资源调度管理:资源调度管理器提供了中央HCRCaaS资源管理和分配容器容器主机。基于Python框架,三个软件框架用于资源调度管理设计如下:(1)使用Python Numpy库的资源调度算法设计、(2)Web服务器网关接口(WSGI)为租户提供了超文本传输协议(HTTP)接口,和(3)消息队列设计软件包使用RabbitMQ服务器发送消息的创建或删除容器容器主机。
的架构基于云计算的提出HCR系统图所示1。
3.2。通信体系结构
如图1有两种类型的通信体系结构的系统:(我)服务通信负责传输手写字符数据容器和返回识别结果。手写字符数据采样的时间连续数据客户端设备,例如,一个智能手机。客户端设备存储字符索引字典,字符的索引在识别引擎是一样的。系统从客户端设备接收数据并返回识别结果,其中包含字符的最大概率指数分类。客户端设备使用的最大概率指数为用户提供候选人的性格。(2)管理沟通提供消息queueing-RabbitMQ服务之间的资源调度管理器和其他服务器。主要负责传输消息从租户服务器。使用创建容器作为一个例子,租户发送一条消息到资源管理服务器。然后,消息传播给消息队列服务器。服务器交换信息与资源调度策略发送一个命令创建容器的消息到目标服务器。完成动作后,目标服务器回复与租户的消息通过消息队列服务器。管理沟通体系结构如图2。
4所示。手写字符识别引擎的设计
近年来,在图像分类DCNN取得了优秀的成果。它有一个更好的模型表达能力。以前的工作(48DCNN)表示,每一层可以相当于一个特殊功能组件,例如,卷积层可以被视为一个特征提取组件,马克斯池层可以被视为一个局部极值组件,和激活函数可以被视为一个非线性回归。一层一层地DCNN可以提取高阶特性,并最终完全连接层集成的输出特性的最后卷积层或max池层分类。因此,DCNN可以被视为一种多层复杂和非线性模型。此外,由于反向传播训练方法对于整个模型,每一层的参数值可以团结一致地调整DCNN使每一层的数据处理更加协调。
获得先进的HCR模型,首先,我们使用一个比较实验DCNN-based获得适当的结构模型。因此,基于以前的工作(33,49),我们设计三个DCNN-based模型,与多个回旋的结构层和完全连接层,为了确定适当的结构。第二,对于正常化,我们使用批量标准化(BN) [50],规范化非线性输入和稳定分布通过减少内部协变量转变提供高等选择使用利率加速网络收敛。对于一些网络深处,BN也可以有效地解决梯度消失的问题。第三,我们使用梯度反向传播训练方法。参数优化的培训过程中,培训损失减少,学习速率时应防止最佳点附近振荡衰减。然而,设置一个小的学习速率可能会导致较低的训练速度落入局部最优解。因此,我们将学习衰变率,增加培训时期的数量。学习速率可以获得如下: 在哪里是训练时期,的数量地下室是学习速率值,然后呢衰减率。
这三个模型使用CASIA-HWDB 1.1数据集(2),300套和1174364份手写样本,训练在一个独立的计算机。训练数据集包括240套。我们使用softmax回归作为输出。输出是描述如下: 在哪里表示相对应的重量和偏见输出和是输入功能。的输出将softmax回归层可以被视为输入手写字符的置信概率,这属于不同的字符类。
证明DCNN-based方法可以获得更好的识别精度,我们使用ICDAR 2013竞争数据集34)进行实验。我们不仅提出了三个模型与传统的方法相比(2,51,52与其他DCNN-based方法[]但也比较34,38- - - - - -40]。比较结果列在表中1。数量1 - 3模型提出的模型和其他人比较模型。
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
设置输入层(“输入”)的行,而当前输入图像的大小(“×大小”)。设置为每一个卷积层(Conv)给出了行,显示数量的输出特征图和接受域大小(“numCsize×号”)。设置指定最大池(MP)的类型和内核大小(“Mpsize×号”)。设置指定完全连接(FC)的维数(“FCdimensionality”)。 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
从表1,结果清楚地表明,DCNN-based方法优于传统方法,并提出了3号模型可以达到最好的效果。此外,证明模型3号表1可以根据型号符合HCR最好,3表1,我们测试模型与不同的结构,例如,结构与一个添加和删除卷积层,结构与一个添加和删除马克斯•池层和结构添加和删除完全连接层。
如表所示2的识别精度DCNN-based不同数量的层模型是低于原DCNN-based模型(即。,3号模型在表1)。这说明3号模型在表1适当的结构3755中国手写字符识别的类。
|
||||||||||||||||||||||||||||||
一些先前的研究,例如,费舍尔基于矢量的方法(53,54],防守蒸馏DCNN [55),有识别力的空间性嵌入字典上优于表示(DSEDR) [56],data-augmentation [57),健壮和稀疏的模糊k - means封顶(RSFKM) [58],GA-Bayes [59),取得了突出的成就在文本分类。此外,注意3755类别只包含中国手写样本。因此,我们比较三个先前提出的模型与方法使用MNIST数据集[60),其中包含10类数字手写样本,如表所示3。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
在表3显然,结果表明,该模型也可以达到类似的结果大于99%位数下手写的数据集。测试拉丁手写识别,我们也使用EMNIST字母数据集(61年),其中包含26个拉丁手写平衡类样品,进行实验。提出模型的输出层的分类数量修改为26。实验结果表中列出4。
|
||||||||||||||||||||||||||||||||||||||
从结果表4,该模型也达到93%或以上的识别精度拉丁手写的数据集。3号模型可以达到最好的结果。
虽然DCNN-based模型优于传统的方法,与经前综合症的表现相比,他们有一个严重的移动设备的响应延迟,因为高时间复杂度。我们使用最好的结果在表3号模型1比较单一的手写样本的平均处理时间在移动设备和点之间。循环展开是一个著名的和有效的策略来提高速度,特别是对于大型循环。此外,布拉斯特区图书馆已被证明是一种有效的方式为CPU-based cnn的实现。我们也使用这些配置优化方法,例如,BLAS图书馆、循环展开,GPU,获得性能结果进行了比较。华为的比较结果伴侣7移动设备和咖啡皇63年)深度学习框架点列在表中5。
|
||||||||||||||||||||||||||||||||
从表5HCR服务在移动设备有严重的延迟。本文的动机是设计HCR基于云计算服务。部署最准确的平行HCRCaaS上手写字符识别服务,我们选择模型(3号)最好的结果表1推进HCR模型演示。基于该模型,我们使用循环展开的方法+巴拉斯自由表5并结合模型和TCP界面库设计前馈DCNN-based HCR引擎。由于手写数据不能保证相同数量的数据点,它们不能直接作为输入数据。因此,在数据输入到HCR引擎之前,系统连接采样点数据随着时间的推移,形成一幅手写输入的DCNN模型。前馈DCNN结构如图3。
编译后识别引擎在咖啡中使用c++深度学习框架,我们部署到容器和容器的容器形象扩张建立在需求。
5。资源调度算法
正如上面提到的,容器,这是一个轻量级虚拟化技术,分享他们的主机资源,例如,CPU,在同一个主机上。由于资源容量限制的点,如果容器的总数低于物理CPU核的数量,每个容器可以使用一个孤立的核心。然而,如果有太多的容器主机在一个容器,容器必须分享这些CPU核,导致资源超额预定和降解性能。然而,资源超额预定意味着点达到更高的资源利用率。因此,资源调度方法需要实现资源利用率和性能之间的权衡。基于体系结构如图1,我们认为HCR服务应遵循“先先来招待”(先)原则,这意味着每个容器可以被认为与一个排队模型 在哪里和是总到达强度和强度的到来容器后,泊松分布,来者等于预期数量的任务在时间 。负载平衡服务器使用循环政策将任务分配给每个容器;因此,每个容器的强度当有系统中的容器。服务速度 ,这是任务的数量及时被处理吗 ,可分为两种类型:(1)当容器的数量低于点CPU核的数量,等于每个CPU核心的服务速率;(2)当容器的数量高于CPU核的数量超过一个集装箱将共享相同的核心服务速率将低于每个核心。
的平均长度队列可以计算
预期的等待时间使用小的公式,可以很容易地发现它的定义是
请注意,也是平均处理时间,我们考虑吗QoS和性能指标。更重要的是,从方程(4)和(5),它可以看出一个可怜的服务速率将导致更糟糕的服务质量根据排队模型。
根据不同数量的容器在同一点,我们测试每个样本的平均处理时间()获得一个相对性能函数。系统性能的不同数量的容器在同一点表中列出6。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
下午已经超额预定时,容器在同一个下午将共享CPU资源。我们认为这是一个线性每个容器的服务速率之间的关系和数量的容器作为
基于表6,我们得到一个线性性能下降的关系函数使用1阶线性微分方程和最小二乘方法。拟合效果和平方指标如图4。
线性函数计算性能下降的关系
平方值是0.998,也就是说,方程(7)描述了性能和容器的数量之间的关系。在这些知识的基础上,我们提出一个贪婪的绩效评估(GPE)资源调度算法来评估每个容器的性能在同一个点。考虑到资源超额预定,该算法找到合适的点放置容器保证QoS贪婪的政策下,提高资源利用率。资源调度是三角的租户或负载平衡服务器下的QoS监控。GPE算法显示了算法的伪代码1。
|
6。实验和分析
为了演示效率,我们设计一个HCRCaaS原型系统。实验系统由七个节点控制器包括一个服务器,一个负载均衡服务器,一个图像存储服务器,主机和四个容器。列出了每个节点的软件配置在表7中,和节点的硬件配置是列在表8。
|
|||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||
此外,一个独立的服务器也用相同的硬件和软件规范的容器主机比较实验。我们执行一系列的实验来评估系统的性能和资源利用率。我们考虑到的处理时间是关键指标HCR服务。处理时间越长,性能越低。
6.1。独立服务器之间的性能比较,容器和KVM
类似于以前的工作(64年),演示HCR对延迟敏感的效率服务容器,这个实验的目的是获得性能损失(即。,处理时间延迟)对比KVM和容器。我们测试独立服务器没有虚拟化技术作为标准最高的性能。从CASIA-HWDB使用32768个样本进行实验2)进行测试的性能HCR服务在不同的环境中。HCR引擎的处理时间的容器,KVM和独立服务器如图5。
从图可以看出5独立服务器的处理时间是最短的,这表明,独立服务器执行最好的。处理时间延迟容器之间的比例和独立服务器,也就是说, ,小于KVM和独立服务器之间,也就是说, 。这是因为KVM是一个大而复杂的软件的过程。每个KVM都有自己的虚拟化硬件资源包括CPU、内存和网卡。此外,KVM必须运行自己的客户操作系统提供一个软件环境;因此,建筑本身导致性能损失。然而,基于Linux的容器是一个轻量级虚拟化容器(LXC),可以直接利用容器主机的硬件资源包括CPU和内存。此外,它不运行来宾操作系统提供运行环境。它可以被认为是一个有用的工具来提供不同的隔离在独立服务器配置。因此,容器可以胜过KVM。由于延迟HCR服务的敏感性,容器可以减少高韧性和敏捷响应延迟提供计算服务质量。这表明容器比KVM在云计算可以实现更高的性能。
6.2。HCRCaaS和独立服务器之间的性能比较
独立服务器的性能和HCRCaaS(即。,16containers in HCRCaaS) is compared under the same hardware specification. The processing time is tested for different numbers of samples from 128 to 131,072. The processing time of HCR is measured from the data arriving at the load balance server to when the test client receives the result. The results of the performance testing are shown in Figure6和表9所示。
|
|||||||||||||||||||||||||||||||||||||||||||||||||
在图6和表9,红线表示HCRCaaS的处理时间,和蓝线表示使用独立服务器处理时间。当样品的数量低于128(光工作负载),HCR引擎可以在短时间内完全处理这些数据。由于负载平衡服务器在HCRCaaS HCRCaaS的处理时间是短的独立服务器。然而,当样本数量的增加和工作负载大,处理时间增加显著的独立服务器而不是使用HCRCaaS时。例如,当样本数量的增加从128年到512年,独立服务器的处理时间增加到9.589年代,虽然在HCRCaaS增加0.5331秒。此外,处理时间比较独立的服务器之间的定量和HCRCaaS131072年的样本。的效率使用HCRCaaS HCR可以显著提高。
我们也比较32768个样本的处理时间在一个主机在不同数量的容器。结果如图7。性能线性增长越来越多的容器,容器的数量低于8。这是因为每个主机包含八个核心,每个容器完全占有一个核心。相比之下,当容器的数量高于核心,超额预定结果在多个容器共享相同的核心,容器性能下降,和,因此,只有云缓慢增加性能。
此外,当容器的数量远远高于核心,存在严重的资源超额预定和退化系统整体性能保证QoS。因此,处理时间增加时,容器的数量大于32。总的来说,性能可以提高集装箱的数量提高资源超额预定并不严重,但是当系统严重超额预定,有一个显著降低系统的性能,因此需要GPE算法。
6.3。与负载平衡服务器性能的比较,没有负载平衡服务器
负载平衡服务器并行计算系统的重要组成部分,负责调度HCR数据不同的容器中。它的性能也可能影响的QoS。我们测试六组样本的处理时间从128年到131072年使用和不使用负载平衡服务器,如图8和表10。样品的数量低于512时,并没有负载平衡服务器的处理时间是相似的。此外,当样本数量的增加,与负载平衡服务器处理时间也略有增加。这是因为数据的大小HCR很小,如上所述,我们认为可以被视为一个负载平衡排队模型。因此,负载平衡服务的性能损失较小。结果表明,性能仍然是最大的损失很小 。
|
|||||||||||||||||||||||||||||||||||||||||||||||||
6.4。GPE之间的性能比较和贪婪算法
评估QoS是如何影响的资源调度算法,我们测试工作负载使用GPE算法和贪婪的调度算法,也就是说,每台主机可以在沉重的资源超额预定达到资源利用率最高。我们平均最大等待时间为0.032秒,用户的数量到16,样本的数量到32768年。结果如图所示9和表11所示。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
从图可以看出9表11,贪婪算法并不能保证QoS容器的数量也在不断增加。这是因为贪婪算法只考虑资源利用率,导致大量资源超额预定将尽可能多的容器在同一个容器主机。GPE算法,当容器的数量低于32,容器将在相同的容器中创建主机的性能是否能保证QoS。然而,当容器的数量高于32和容器在容器托管的最大数量是15保证QoS(基于平均最大等待时间),GPE算法试图找到一个合适的容器主机减少资源超额预定。资源调度策略在这些情况下相当于平均资源调度策略。因此,GPE算法可以实现适当的权衡之间的资源分配和利用平衡。
6.5。资源利用评价和分析
强调资源利用率提高,我们比较和分析传统点集群的资源利用率和HCRCaaS。我们定义的资源利用率比较比率HCRCaaS集群和点如下: 在哪里容器的数量吗容器主机,是容器资源利用率,每个容器的核心利用主机,是主机的数量。当方程的结果(8)增加,越来越多的容器中创建集群。如果比例超过1,容器的数量高于经前综合症。因此,较大的方程的结果(8),资源利用率越大。根据节5,我们假设 。基于硬件的配置,我们比较集群资源利用率比较比率HCRCaaS和点之间在不同数量的容器在PMs的数量是4(即,k= 4)。结果列在表12。很明显,资源利用率提高系统容器数量的增加。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
7所示。结论
在本文中,我们设计了一个基于容器的手写字符识别系统云来更好地利用手写字符识别技术。使用并行计算和轻量级虚拟化技术,我们成功地改善了系统的性能。为了克服问题造成的资源超额预定,我们提出了一个绩效评估方法来评估每个容器的性能随着资源大小改变。使用贪婪策略,我们设计了一个GPE算法保证QoS,提高资源利用率。我们的实验表明,该系统效率显著增加与容器的扩张。这个系统可以很容易地扩展到其他应用程序,例如,文本行识别,公式识别、模式识别、图像和视频模式识别。通过亚马逊系统还可以很容易地部署,Rackspace,或Windows Azure和私有云计算平台。
未来的工作将致力于改善系统三个方面。首先,我们将使用更多的功能,如猪或改善模型筛选获得更准确的识别。第二,我们将评估更多的模型如多空项内存模型,以提供更有效、准确的识别。第三,完善资源调度方法提供了一种自适应可伸缩的方法在该容器的数量可以根据工作负载自动调整。此外,我们将设计一个工作负载预测模型对积极的调度资源政策。这将避免频繁的租户监测工作量和优化资源利用率。
数据可用性
之前报道CASIA数据集用于支持这项研究和可用http://www.nlpr.ia.ac.cn/databases/handwriting/home.html。MNIST数据集用于支持这项研究和可用http://yann.lecun.com/exdb/mnist/。EMNIST数据集用于支持这项研究和可用https://www.nist.gov/itl/iad/image-group/emnist-dataset。
的利益冲突
作者宣称没有利益冲突。
确认
这项研究的部分支持由广东省科学技术项目(批准号。2017 a010101027, 2015 b010101004, 2015 b010131004),中国国家自然科学基金(批准号。61472144,61472144),GD-NSF(没有。2017 a030312006),广州的科技项目,中国(批准号201707010160),中国国家重点研发项目(没有。2016 yfb1001405)。
引用
- h .藤泽”,四十年的研究在性格和文档recognition-an工业的角度来看,“模式识别第41卷。。8,2435 - 244年,2008页。视图:出版商的网站|谷歌学术搜索
- f . c . Liu, d . Wang和Q.-F。王”,在线和离线手写汉字识别:新数据库基准测试,”模式识别,46卷,不。1,第162 - 155页,2013。视图:出版商的网站|谷歌学术搜索
- g . Wang和t·e·Ng”Amazon EC2的虚拟化对网络性能的影响数据中心,”学报IEEE计算机通讯大会上(信息通信)圣地亚哥,页1 - 9、钙、美国,2010年3月。视图:谷歌学术搜索
- L R野生动物,赵,吴X et al .,点对点云配给:云计算服务发现和负载平衡施普林格,伦敦,英国,2010年。
- s . Abolfazli z Sanaei, a . Gani f·夏,W.-M。林,“RMCC:宁静的移动云计算框架,利用相邻服务移动薄云,”IEEE会议云计算技术和科学学报》(CloudCom)2014年12月,页15日,新加坡,。视图:谷歌学术搜索
- y, y金、h·汉和美国康,“细粒度,自适应资源共享的实际使用率来定价云,”学报IEEE会议云和自主(ICCAC),页236 - 243,波士顿,MA,美国,2015年9月。视图:谷歌学术搜索
- j . Veen e . Lazovik m . Makkes, r·j·梅耶尔”部署策略的分布式应用程序在云计算基础设施,”IEEE会议云计算技术和科学学报》(CloudCom)233年,页228 - 2013年12月,英国布里斯托尔。视图:谷歌学术搜索
- f·卡和a。Gokhale iOverbook:智能resource-overbooking支持软实时应用程序在云中,”云计算IEEE会议程序安克雷奇,页538 - 545年,正义与发展党,美国,2014年6月。视图:谷歌学术搜索
- y LeCun (y Bengio g·辛顿,“深度学习”,自然,卷521,不。7553年,第444 - 436页,2015年。视图:出版商的网站|谷歌学术搜索
- Triguero, d·佩拉尔塔j . Bacardit s加西亚和f . Herrera”MRPR: MapReduce减少大数据解决方案原型分类,“Neurocomputing卷,150年,第345 - 331页,2015年。视图:出版商的网站|谷歌学术搜索
- j .润湿,Breitenbucher、o .科普和f . Leymann”简化为云应用程序使用托斯卡DevOps自动化标准化的元模型,”未来一代计算机系统,56个卷,第332 - 317页,2015年。视图:出版商的网站|谷歌学术搜索
- a . Kaceniauskas r . Pacevic诉Starikovicius, a . Maknickas m . Staškūnienė和g . Davidavičius”开发云服务构建的模拟血液流经主动脉瓣,“工程软件的进步卷,103年,页57 - 64,2017。视图:出版商的网站|谷歌学术搜索
- a . Anjum t·阿卜杜拉·m·塔里克y Baltaci,和n . Antonopoulos“云视频分析:一个高性能视频目标检测和分类框架分析,“IEEE云计算,2016年。视图:出版商的网站|谷歌学术搜索
- t . Verbelen t·史蒂文斯、f . Turck和b . Dhoedt”图划分算法优化软件部署在移动云计算中,“未来一代计算机系统卷,29号2、451 - 459年,2013页。视图:出版商的网站|谷歌学术搜索
- d·t·l·金,w·刘,李x”黑森正规化的支持向量机对移动图像注释在云上,“IEEE多媒体,15卷,不。4、833 - 844年,2013页。视图:出版商的网站|谷歌学术搜索
- b . Tripathy d·米塔尔,“基于Hadoop的不确定的可能性kernelized c均值算法对图像分割和比较分析,“应用软计算,46卷,第923 - 886页,2016年。视图:出版商的网站|谷歌学术搜索
- d .夏王,h·李,李y和z,”一个分布式时空加权模型对短期交通流预测的MapReduce,”Neurocomputing卷,179年,第263 - 246页,2016年。视图:出版商的网站|谷歌学术搜索
- 瞿l . j .鑫z . Wang, g . Yu和y Kang”MapReduce A-ELM:自适应分布式极端的学习机器,”Neurocomputing卷,173年,第374 - 368页,2016年。视图:出版商的网站|谷歌学术搜索
- c, c, d . Chen和k·t·Ng”MapReduce限制玻耳兹曼机分布式学习算法为基础,“Neurocomputing卷,198 4,2016页。视图:出版商的网站|谷歌学术搜索
- 夏y、m .周x罗问:朱、黄和y . j . Li“随机建模和质量评价iaas云。”IEEE自动化科学与工程,12卷,不。1,第170 - 162页,2015。视图:出版商的网站|谷歌学术搜索
- y蒋介石,y欧阳,c .许“高效绿色成本优化控制算法在云计算中,“IEEE云计算,3卷,不。2、145 - 156年,2015页。视图:出版商的网站|谷歌学术搜索
- j . Du c .江钱y, z .汉,和y任,“在云空间资源分配与视频流量预测系统”IEEE多媒体,18卷,不。5,820 - 830年,2016页。视图:出版商的网站|谷歌学术搜索
- 李,周y,焦l . et al .,“对运营成本最小化混合云与Delay-aware动态资源配置优化,“IEEE服务计算,8卷,不。3、398 - 409年,2015页。视图:出版商的网站|谷歌学术搜索
- h . Khazaei j .阅读,和v .阅读,“性能分析云计算中心使用M / G / M / M + r排队系统,”IEEE并行和分布式系统,23卷,不。5,936 - 943年,2012页。视图:出版商的网站|谷歌学术搜索
- j . Bi h .元,w . Tan和b·李”TRS:时间请求调度与有界延迟保证绿色云计算数据中心,“信息科学卷,360年,页57 - 72,2016。视图:出版商的网站|谷歌学术搜索
- s . Vakilinia m·阿里,d .秋”建模资源分配的云计算中心,“计算机网络卷,91年,第470 - 453页,2015年。视图:出版商的网站|谷歌学术搜索
- 问:张先生,m . Zhani女士说,r . Boutaba和j·l·Hellerstein“动态heterogeneity-aware资源配置在云中,”IEEE云计算,卷2,不。1,14-28,2014页。视图:出版商的网站|谷歌学术搜索
- j .曹k·李,i Stojmenovic”最优功率分配和负载分布多个异构多核服务器处理器在云和数据中心,“IEEE计算机,卷63,不。1,45-58,2014页。视图:出版商的网站|谷歌学术搜索
- 李y, b, b . Li“价格竞争在一个有多个IaaS云提供商的寡头垄断市场,”IEEE计算机,卷63,不。1,59 - 73年,2014页。视图:出版商的网站|谷歌学术搜索
- 圣Maguluri和r . Srikant”与未知时间云调度工作,”IEEE网络,22卷,不。6,1938 - 1950年,2014页。视图:出版商的网站|谷歌学术搜索
- x y . Wang叮,c .刘”MQDF歧视基于学习的脱机手写汉字识别,”IEEE会议程序文档分析和识别(ICDAR),页21页,北京,中国,2011年9月。视图:谷歌学术搜索
- m·周x张f .阴,C.-L。刘”,区别的二次特征学习手写汉字识别,”模式识别卷,49岁,7 - 18,2016页。视图:出版商的网站|谷歌学术搜索
- b·格雷厄姆“稀疏阵列的在线签名字符识别,”2013年,http://arxiv.org/abs/1308.0371v2。视图:谷歌学术搜索
- f .阴王,张x, C.-L。刘:“ICDAR 2013中文手写识别竞争,”IEEE会议程序文档分析和识别(ICDAR)华盛顿特区,页1464 - 1470,美国,2013年8月。视图:谷歌学术搜索
- n Murru和r·罗西尼,”贝叶斯方法初始化权重的反向传播神经网络应用于字符识别,”Neurocomputing,卷193,不。12日,第95 - 92页,2016年。视图:出版商的网站|谷歌学术搜索
- z d . t l .金张,杨和y . Wang“稀疏的区别的信息保护汉字字体分类”Neurocomputing卷,129年,第167 - 159页,2014年。视图:出版商的网站|谷歌学术搜索
- b . p . Wang, j .徐g .田C.-L。Liu和h,“语义扩张使用字嵌入集群和卷积神经网络对提高短文本分类、”Neurocomputing卷,174年,第814 - 806页,2016年。视图:出版商的网站|谷歌学术搜索
- z z中,l·金和谢,“高性能脱机手写汉字识别使用GoogLeNet和方向特征图,”IEEE会议程序文档分析和识别(ICDAR)突尼斯,页846 - 850年,突尼斯,2015。视图:谷歌学术搜索
- w·l·陈,美国Wang粉丝,j .太阳和s . Naoi“超出人类识别:CNN-based手写字符识别框架,”学报》3日IAPR亚洲会议模式识别,页695 - 699,吉隆坡,马来西亚,2015年11月。视图:谷歌学术搜索
- W . c . Wu风扇W, y, j .太阳和s . Naoi“手写字符识别的交替训练放松卷积神经网络”学报》第14届国际会议在手写识别领域,页291 - 296,克里特岛,希腊,2014年9月。视图:谷歌学术搜索
- w·劳埃德·s . Pallickara o . David j . m .而里昂和k·罗哈斯,“性能影响的多层应用程序部署在iaas云:对性能建模、”未来一代计算机系统卷,29号5,1254 - 1264年,2015页。视图:出版商的网站|谷歌学术搜索
- f . Hermenier X洛尔卡,j . Menaud g·穆勒和j . Lawall“熵:一个集群整合经理”学报ACM SIGPLAN / SIGOPS虚拟执行环境ACM国际会议页。每周,华盛顿,美国,2009年。视图:谷歌学术搜索
- w .跳纱,费雷拉,r . Rajamony和j·卢比奥,”一个更新虚拟机的性能比较和Linux容器,”学报IEEE国际研讨会(ISPASS)的性能分析系统和软件,页171 - 172年,费城,宾夕法尼亚州,美国,2015年3月。视图:谷歌学术搜索
- Kaur k, t . Dhand:库马尔,s . Zeadally”Container-as-a-service边缘:能源效率和服务可用性之间的平衡在雾nano数据中心,“IEEE无线通信,24卷,不。3,48-56,2017页。视图:出版商的网站|谷歌学术搜索
- l . Affetti g . Bresciani,几内亚,“aDock:云基础设施实验环境中基于开放堆栈和码头工人,”云计算IEEE会议程序,页203 - 210,纽约,纽约,美国,2015年6月。视图:谷歌学术搜索
- r·卡列罗斯e . Masoumi r .野生动物和r . Buyya工作负载使用ARIMA模型预测及其对云应用QoS,”影响IEEE云计算,3卷,不。4、449 - 458年,2015页。视图:出版商的网站|谷歌学术搜索
- 答:威德拉和j·威廉姆斯,RabbitMQ在行动:分布式消息传递给每个人曼宁出版物公司格林威治,伦敦,英国,2011。
- Cai, x, k .贾c, d .道,“DehazeNet:端到端系统单一图像烟雾去除,”IEEE图像处理,25卷,不。11日,第5198 - 5187页,2016年。视图:出版商的网站|谷歌学术搜索
- 肖x l·金,y, w·杨,j .太阳和t . Chang,“构建快速、紧凑的卷积神经网络离线手写汉字识别,”模式识别卷,72年,第81 - 72页,2017年。视图:出版商的网站|谷歌学术搜索
- 约飞和c . Szegedy“批量标准化:加速深层网络训练通过减少内部协变量转变,”在机器学习(ICML)国际研讨会论文集里尔,页448 - 456年,法国,2015年7月。视图:谷歌学术搜索
- 傅,问:叮,t . Liu江y, z . Ren,”一个新颖的分割和识别算法对中国手写的地址字符串”模式识别会议学报》上,页974 - 977,香港,中国,2006年8月。视图:谷歌学术搜索
- t·苏“中国手写识别:算法的角度来看,”施普林格在电气和计算机工程简报施普林格,柏林,德国,2013年。视图:谷歌学术搜索
- c .史y . Wang f·贾,k .他和肖b, c . Wang”费舍尔向量为场景字符识别:一个综合评价,“模式识别卷,72年,页1 - 14,2017。视图:出版商的网站|谷歌学术搜索
- c . y . Wang, b, c . Wang和c .气”Multi-order同现激活与费舍尔向量编码字符识别,”模式识别的字母卷,97年,第76 - 69页,2017年。视图:出版商的网站|谷歌学术搜索
- n . Papernot p·麦克丹尼尔,吴x, s . Jha和偶像,“蒸馏作为防御敌对的扰动对深层神经网络”IEEE学报》研讨会上安全和隐私(SP)圣何塞,页582 - 597年,CA,美国,2016年5月。视图:谷歌学术搜索
- c .史,美国高,m .刘et al .,“中风探测器和结构模型为基础字符识别:比较研究,“IEEE图像处理,24卷,不。12日,第4964 - 4952页,2015年。视图:出版商的网站|谷歌学术搜索
- a . s . Wong关贸总协定、诉Stamatescu和m·d·麦克唐纳”理解数据增加分类:当变形?“在学报》国际会议上数字图像计算:技术与应用(格言)黄金海岸,页1 - 6,昆士兰,澳大利亚,2016年11月。视图:谷歌学术搜索
- j .徐j .汉k .熊et al .,“健壮和稀疏的模糊k - means聚类”人工智能国际联合会议(IJCAI)展出,页2224 - 2230,纽约,纽约,美国,2016年7月。视图:谷歌学术搜索
- t . Vo-Van h . Che-Ngoc, t . Nguyen-Trang”结构特征选择图像分类的贝叶斯方法,”学报》国际会议对自然计算,模糊系统和知识发现(ICNC-FSKD)桂林,页731 - 737年,中国,2017年7月。视图:谷歌学术搜索
- y Lecun (l . Bottou y Bengio, p . Haffner“Gradient-based学习应用于文档识别,”IEEE学报》,卷86,不。11日,第2324 - 2278页,1998年。视图:出版商的网站|谷歌学术搜索
- g·科恩,s . Afshar j . Tapson et al .,“EMNIST: MNIST手写信件的延伸,“http://arxiv.org/abs/1702.05373。视图:谷歌学术搜索
- a . Schaik和j . Tapson”在线,榆树权重自适应伪逆解。”Neurocomputing卷,149年,第238 - 233页,2015年。视图:出版商的网站|谷歌学术搜索
- y, e . Shelhamer j·多纳休et al .,“咖啡:快速卷积架构功能嵌入”学报》国际会议多媒体(ICM)奥兰多,页675 - 678,美国,2014年8月。视图:谷歌学术搜索
- l .阴罗j . h·罗,“任务调度和资源分配在雾计算基于智能制造的容器,”IEEE工业信息, 2018年。视图:出版商的网站|谷歌学术搜索
版权
版权©2018雷雳et al。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。