文摘
考虑到一些智能软件在移动设备上的位置传感器和相关设备,回归测试面临着重大挑战。测试用例优先级(TCP),作为一种回归测试优化技术,有利于提高测试效率。然而,传统的TCP技术可能限制测试智能软件嵌入到移动设备,因为他们不考虑移动设备的特点。本文使用智能购物中心作为一个场景来设计一种新颖的基于位置的TCP技术软件嵌入到移动设备使用引力定律。首先,测试万有引力提出了通过应用万有引力的想法。第二,一个特定的计算模型测试万有引力是专为智能商场场景。第三,如何创建一个指责伪代码设计的测试用例集。第四,基于位置的TCP使用引力定律算法,利用测试用例信息,故障信息和位置信息来确定测试用例优先级。最后,实证评价提出了通过使用一个工业项目。的观察,实验结果,我们提出TCP方法比传统的TCP技术性能更好。此外,除了位置信息,设备的水平也是一个重要因素影响优先级效率。
1。介绍
如今,物联网(物联网)发展越来越广泛1]。它是基于无线传感器网络(网络),结合智能软件和传感器设备,使智能家居和智能城市可能2,3]。随着硬件(芯片)和软件的发展(智能系统),智能移动设备(如智能尘埃)正逐渐出现,集成传感器、处理器、智能软件和通信。智能移动设备传输和监控信息不仅有能力而且执行复杂的智能信息处理和智能预测的智能软件(4)和基于位置的服务(LBS) [5]。每个设备都有其特定的功能的软件。例如,一些设备是用于监控和处理温度信息和其他用于处理人口信息。设备提供依赖所在信息,与其他设备依赖所在。它是位置信息和软件设备的复杂性,使软件测试在物联网面临一个重大的挑战。
执行回归测试,重用测试套件,在修改程序安装信心系统能否正常运转和修改没有不利影响的不变部分项目(6]。测试用例优先级(TCP),排序测试用例根据某些标准,是一种提高回归测试的效率(7]。它旨在提高故障检测率。传统的TCP技术主要集中在算法设计为测试软件测试优先级效率的提高。然而,在物联网中,传统的TCP技术有局限性,因为他们不考虑硬件设备的特点,如位置信息。
根据万有引力定律,牛顿的《自然哲学的数学原理》(8),表明有任何两个物体之间的引力吸引现有的力,这是由以下方程: 在哪里G万有引力常数,一个物体的质量,其他物体的质量,的半径是每个对象的质心之间的分离,然后呢两个物体之间的引力。万有引力已经应用于数据分析领域。例如,许多研究使数据引力(万有引力模拟)适用于机器学习(9- - - - - -11]。在物联网中,如果我们可以利用万有引力定律优先测试用例,会提高测试效率吗?
在这篇文章中,一个新的定位TCP使用引力定律解决TCP技术开发软件嵌入到移动设备的问题。这种技术是为适应智能商场场景而设计的。不仅仅是一个测试用例优先级方法但此外使设备使用特点,从而使测试用例的顺序为测试工作是有益的。测试万有引力定义在这个技术。在这个定义下,一个特定的计算模型测试万有引力智能商场场景设计。首先,它计算每个测试用例的质量和每一个断裂测试用例。断裂的创建测试用例集相关的发生故障检测的预选的测试用例,测试different-location-area设备的代表。然后,两个特定的测试用例之间的距离可以根据位置信息的设备计算。对于每个测试用例,测试万有引力计算每个指责从这个测试用例的测试用例。最后,测试用例优先级是基于测试万有引力。
这项工作的贡献包括以下:(我)测试万有引力提出了基于引力定律。一个特定的计算模型测试万有引力适应智能商场场景。特别,指责的创建测试用例集的计算中使用测试万有引力详细设计。(2)定位TCP使用万有引力定律技术提出及其算法伪代码设计的。用一个小例子说明了其可行性。(3)实证评估提出了通过使用一个工业项目。此外,还将讨论是否不同的评价指标(有或没有考虑断层的清规戒律)会影响实验的结论。还讨论了哪些因素影响优先级效率。
本文的其余部分组织如下:部分2描述测试用例优先级问题,传统的TCP技术,特殊的TCP技术,TCP问题智能商场场景。部分3提出了一种基于位置的TCP使用万有引力定律的方法,模拟了其可行性与一个例子。部分4描述了一个实证评价和分析结果。部分5讨论一些相关的测试用例优先级和移动应用程序测试工作。最后,给出了结论和未来的工作部分6。
2。背景
2.1。测试用例优先级方法
回归测试,试图验证修改版本最初的计划 ,检查结果符合要求(12]。提出了许多技术来提高回归测试的成本效益。测试用例优先化是其中的一个方法,将测试用例来提高故障检测率在整个回归测试。
测试用例优先级问题是软件测试领域的一个研究热点。这类测试用例通过一些标准来发现更多的错误尽可能快。TCP的完整定义问题首次提出了Rothermel et al。13]:
鉴于一个测试套件已经选择(T),所有可能的优先级(序)T(PT),和一个目标函数PT实数(f),产生一个奖项的排序值。
问题。找到这样 。
许多测试用例优先级技术提出了在过去的二十年。Elbaum和Rothermel出版社(13- - - - - -16]讨论了测试用例优先级技术的细粒度的实体,如覆盖优先级(声明或分支覆盖,等等)和fault-exposing-potential(聚全氟乙丙烯)优先级。与此同时,总提出了策略和其他策略(15]。都是建立在贪婪算法选择一个局部最优解在每一轮的搜索空间。Srikanth et al。17- - - - - -19)提出了一种价值观取向的方法叫做港口不需要结构覆盖率信息。港口算法是基于四个因素:客户优先级、需求波动,实现复杂性和断层倾向的需求。Arafeen和做20.)提出了一个测试用例优先级技术使用集群的基础。它包含传统的代码分析信息,可以提高测试用例优先级技术的有效性。
2.2。传统的TCP技术
现有TCP methods-prioritizing基于测试用例的覆盖率(16)或要求(19],甚至time-aware [21,22)——所有基于优化软件系统本身。也就是说,传统的TCP方法专注于改进自己的方法。他们考虑的因素是基于软件的特点和不涉及硬件的特性。大多数软件测试也是跨平台的web应用程序。
有几个经典的测试用例优先级技术,介绍如下:随机的优先级(16]。随机随机测试用例优先级订单。它是简单和方便,但不稳定。总覆盖优先级(16]。这订单测试用例基于后代数量的单位被这些测试用例覆盖。当多个测试用例覆盖相同数量的单位,顺序是随机决定的。额外的覆盖优先级(16]。这订单的测试用例实现最大化覆盖尽可能早。它首先选择最大的测试用例覆盖然后先后增加了这些测试用例,覆盖最还发现部分。要求测试的优先级(港口)(17- - - - - -19]。这订单测试用例基于加权优先(WP)值的降序排列,这样的测试用例具有更高WP值将被命令在前面。最佳优先级(16]。它重视测试用例使用的缺点,可以获得最大化一个测试套件的测试用例的顺序的故障检测率。它提供了一个上限其他启发式的有效性。
2.3。TCP技术利用执行信息
当一个测试用例被执行,它生成的执行信息,比如它的故障检测。随着回归测试变得更加复杂,学者们认为执行测试历史信息的影响当前的测试优先级。
2.3.1。基于历史TCP
一种基于历史TCP技术(23)类测试用例的选择概率计算显示测试的历史。它定义了每个测试用例的选择概率如下: 在哪里是选择概率,是测试历史,平滑常数用于重量个人历史。
三个测试记录(根据每个测试用例的执行历史,其故障检测,和程序实体它覆盖)一直在调查测试优先级的影响。他们的实验结果表明,历史信息可能有助于降低成本和增加长期运行回归测试过程的有效性。
2.3.2。自适应TCP
动态规划的主要方法(24),自适应的想法也被运用于测试用例优先级。这里介绍两种类型的自适应TCP技术。他们都利用的影响发生故障优先测试用例在当前测试。
(1)自适应TCP指导下输出检查。一种自适应测试用例优先级指导下输出检查(25],它结合了案例调度过程和测试用例执行过程中,将测试用例如下过程:
首先,它计算初始故障检测能力的所有测试用例基于前面的输出的执行信息,然后选择一个测试用例t最大的故障检测能力。第二,t对修改后的程序执行,记录的输出吗t。第三,它修改的故障检测能力基于剩余没有选择测试用例t的输出和选择测试用例修改最大的故障检测能力。第四,它重复前两个步骤,直到所有的测试用例优先级和运行。
(2)TCP基于自适应抽样策略。TCP使用集群过滤技术(26,27)测试用例选择和按优先级排序如下过程:首先,它分区测试套件基于聚类分析;然后,选择测试用例根据抽样策略;最后,它重视选择测试用例。在抽样策略自适应采样策略是首先从每个集群最初随机选择一个执行,然后其他的集群选择从集群如果第一个选择是一个失败。
2.4。TCP问题智能商场场景
图1是一个简单的分配图的移动设备智能商场场景。在图中,一个无线发射器的图标代表一个智能移动设备提及和研究。云图标代表中央处理。有手机的人代表了一个手持移动设备。其中,白色的设备分布在特定位置(商店)监视和处理特定的位置信息。黑色的设备分布在商场监控特定类型的信息和执行分布式信息处理。每个移动设备在购物中心都有自己的独特功能;也就是说,其内部智能软件达到特定的需求。综合测试软件的设备在整个商场变得极其复杂。例如,像图2,每个餐厅都有一个移动设备管理这家餐厅的信息。通过互联网,它可以监视传入的客户的数量/剩余座位,菜的数量,温度,等等,并将位置偏好,食物偏好等客人(其他移动设备)进入餐厅。购物中心的大厅里,有restaurant-proxy移动设备收集实时餐厅和人数据,通过无线网络。也聪明地把最好的餐馆(附近的空等)商场客户(其他移动设备),目前通过互联网。这可以实时安排商场客户,可能会避免发生,所有客户拥挤在一个饭店门前。所有的数据需要传输到控制中心通过无线网络进行大规模数据的处理。
当讨论TCP问题在聪明的购物中心的情况下,传统的TCP方法可以提高通过添加位置信息的排序测试用例测试以便适应新的场景。移动设备位于不同的位置,使他们交流更频繁(功能上更紧密的互动)之一与其他设备。根据设备之间的距离,智能软件连接到设备的功能之间的相关性强弱。如图1黑色的,软件功能设备左边应该有一个伟大的和软件功能的关系的其他三名白人设备与黑色的设备。测试用例测试软件功能的移动设备。我们设置一个测试用例的粒度测试所有的功能需求的移动设备。通过这种方式,传统的测试用例之间的节点图变得实际移动设备(图之间的节点图3)。在图3左侧椭圆是一个测试用例节点图,一个圆圈图标表示一个测试用例,和椭圆设备节点图是一个正方形图标表示一个移动设备。r代表测试用例或设备之间的距离。虚拟测试用例之间的距离映射到实际的设备之间的距离。
3所示。基于位置的TCP使用引力定律
本节结合测试用例信息、故障信息和位置信息,提出一种新的基于位置的TCP技术使用引力定律。
3.1。测试万有引力
测试万有引力(TG)介绍了模拟方法的万有引力。测试重力F在两个测试用例t一个和tb可以定义如下: 在哪里是测试引力常数,和的质量是和 ,分别为,之间的距离是和 。
回归测试的环境有关。如果标准米和r是肯定的,应该是唯一的。在本文中,我们将研究对该方法的影响。所以,设置为1。
不同属性的测试用例可以代表不同的物质组成这个测试用例。如果这个测试用例检测到错误,错误的属性,这是另一种类型的物质,也包括这个测试用例。两种类型的属性(物质)的重量一起构成了这个测试用例的总质量。
定义1。测试用例的质量 。质量的测试用例t定义如下: 在哪里的属性的总数吗 , 的重量是我th的属性 , 错误的总数吗检测,的属性的总数是一个错,的重量是我这种故障的属性是一个平滑常数,它是什么 。
例如,在实施过程中,可以表示成一个测试用例的覆盖率和可以表示成一个测试用例的重要性级别;可以表示成位置错误,可以表示为一个故障的严重程度,等等。
因为故障不能提前知道在实际测试过程中,有两种方法可以获得故障和它们的属性。一种方法是预先调整的缺点,可以基于专家决策或深度学习;另一种方法是利用发生故障。
定义2。距离r。它表明了两个测试用例之间的距离,表示 。
例如,r可以计算根据测试用例之间的业务级(树关系)或根据设备之间的空间距离。
3.2。TG计算模型
在聪明的购物中心的情况下,根据上述定义,我们设计一个特定的计算模型TG准备测试用例优先级。这个模型计算一个力F从测试用例到测试用例而遭到指责。(1)重要性水平(“透明国际”一个测试用例选为唯一的属性吗 。“透明国际”是由功能的移动设备(戴斯。莱纳姆:),t测试。的质量t是 在哪里设备测试 。 分为5个层次。它可以用一个线性赋值,如 ,或一个非线性的任务,如 。(2)故障严重程度(FS)选择的唯一属性的错 。的值FS和“透明国际”(戴斯。莱纳姆:)组成 ;这是 在哪里指责该设备测试的测试用例吗和是jth断层探测到 。 分为5个层次,像什么戴斯。莱纳姆:。发生故障,检测到预选的测试用例在当前测试,用于创建一组断裂测试用例(罚球)。的形成罚球将部分详细描述3所示。3。(3)空间位置距离设备的选择计算r r的设备之间的三维欧几里得距离是一个测试用例测试和设备的断裂测试用例测试,如图4。这是定义如下: 在哪里软件测试的设备吗 ,和设备测试 。(4)从上面的,具体的计算模型TG一个测试用例之间和一个断裂的测试用例如下: 在哪里软件测试的设备吗 , 设备测试的检测e的缺点,是jth断层探测到 。
3.3。断测试用例集
发生故障检测到一些预选的测试用例在当前测试作为节中提到的缺点3所示。2发生,所以如何收集这些缺点来创建一个罚球是一个重要的步骤。错误连接到设备。我们使用的设备来获得罚球。算法1描述了一个聚类过程的设备。欧氏距离作为不同指标。
|
设备集群后,随机选择一个设备从每个集群作为集群的代表。测试用例测试代表被注入一个测试子集圣。圣是执行。如果发生故障,测试用例,发现这些断层组合成一个罚球。算法2展示了这一过程的伪代码。
|
3.4。基于位置的TCP算法使用引力定律
定义3。测试用例优先级 。它表明了一个测试用例的优先级执行顺序。优先级定义如下: 在哪里断测试用例的数量和吗是力F这个测试用例的我断裂的测试用例。越大值是,早将执行这个测试用例。
算法3显示了基于位置的TCP使用万有引力定律的方法。它的输入是一个测试套件T。它的输出是优先测试顺序T′。首先,米每个测试用例的t计算根据移动设备的水平t测试。第二,指责测试用例集罚球根据算法创建1和2。米每个指责的测试用例基于计算FS和戴斯。莱纳姆:。第三,距离r之间t和每个可以根据位置信息的设备计算。第四,为每一个t,力F计算从这个t对每一个 。第五,优先P每一个t计算根据F。最后,测试用例按降序排序P获得优先执行顺序进行测试T′。
3.5。例子模拟智能商场
我们模拟一个智能商场场景图5解释如何确定测试用例优先级。有五个移动设备(d1- - - - - -d5)在图中,方块所示。每个设备是一个测试用例的测试内部智能软件功能。所以,有五个测试用例(t1- - - - - -t5),圆圈所示。假设设备集群分为2集群:和 。 和随机提取设备的代表,和一个子集圣{t2,t4}就形成了。圣运行后,两个错误(f1和f2)发现了t2,这是明星的图。图中虚线显示两个设备之间的三维欧氏距离。
在上面的例子中,让我们考虑一个测试用例优先级问题定义在一组5测试用例一组一个断裂的测试用例罚球( )从表1。从图5根据设备的位置,得到了测试用例之间的距离,如表1。我们假设所有的缺点(包括他们的严重性级别)发现在当前的测试回合如表所示2。
我们把t1作为示例,计算力F的t1来 ,作为F1= 0.135。根据方程(9),我们的优先级值t1这是P1= 0.135。同样,优先级P的t2,t3,t4,t5是P2= 22.5,P3= 0.28125,P4= 0.0002,P5= 0.000225。优先级的顺序是t2- - - - - -t3- - - - - -t1- - - - - -t5- - - - - -t4,APFDc(28这个顺序的值是78.57%。根据表2,最佳的测试用例优先级排序顺序t2- - - - - -t3- - - - - -t1- - - - - -t5- - - - - -t4(或t2- - - - - -t3- - - - - -t1- - - - - -t4- - - - - -t5),其APFDc值是78.57%。随机测试用例优先级排序顺序t5- - - - - -t1- - - - - -t3- - - - - -t2- - - - - -t4,他的APFDc值是41.43%。可以看出我们的定位的影响TCP使用引力定律有很好的效果,甚至是与最优优先级一致。
4所示。实证评估
调查方法的有效性,称为定位TCP,使用引力定律(L-TCP从现在开始),实证评估的执行以下研究问题:(我)RQ1: L-TCP方法更有效的故障检测率比其他传统的优先级技术?这个研究问题旨在了解L-TCP方法可以检测故障是否比其他传统的测试用例优先级技术。要回答这个问题,本文应用四个传统的TCP技术进行比较。(2)RQ2:当评估效率的技术,有什么不同的实验结论是否考虑故障的严重性吗?是否考虑断层无疑会产生影响的严重性的判断优先级的效果。本研究问题主要讨论了两个评价指标对实验结论的影响。(3)RQ3:除了位置信息外,其他因素相关的优先级效率也?在智能商场场景中,测试优先级效率的软件可能与移动设备的信息。这个研究的问题结合了上述两个问题的分析,讨论影响效率因素的优先级。
4.1。对象
本实验研究中使用的对象是一个真正的工业项目对芯片测试和大约140000行代码(LOC),完全。它有很多版本,每个版本都有一些要求。每个版本的测试套件是相对较小。测试用例的粒度是粗粒度的。也就是说,每个测试用例可能包含几十个甚至几百个测试脚本,但是它只测试一个芯片功能(需求)。这些特性可以用来模拟测试数据智能商场场景。首先,硬件芯片的功能类似于智能设备,所以缺点可能是类似的特点,。第二,每个测试用例只覆盖一个具体要求,可以模拟来测试一个移动设备。第三,有许多轮(版本)的回归测试,还有每一轮中引入的新测试用例,可以模拟一个循序渐进的集成测试环境智能商场场景。项目数据包括测试用例的数量、功能需求覆盖的测试用例,测试用例发现的错误,错误的严重性,等等。 We use this project data as a basis and then simulate the distance data between devices. Finally, they are formed into a complete data required for this experiment. There are six versions chosen for this experiment. The basic information is shown in Table3。
4.2。变量和措施
4.2.1。准备独立变量
解决我们的研究问题,操纵一个独立变量:测试用例优先级技术。除了我们提出L-TCP方法,遵循传统的测试用例优先级方法也被用来实现比较。(我)随机(R):这种技术使用随机顺序的测试用例优先级技术不使用位置信息优先级的设备。(2)总覆盖率(TC):这技术使用总覆盖订单测试用例优先级技术不使用位置信息优先级的设备。(3)额外的覆盖(AC):这种技术使用额外的覆盖订单测试用例优先级技术不使用位置信息优先级的设备。(iv)需求优先级(港口):该技术使用优先级要求的测试技术来测试用例不使用位置信息优先级的设备。
4.2.2。因变量和度量
具体措施给出了这些实验的因变量。
APFD。迅速衡量一个优先测试套件检测故障,故障检测的平均百分比(APFD)作为因变量。
APFD(28),检测故障的比例的加权平均,侧重于故障检测率在测试一个测试套件的生活。它假设错误的严重性是等价的。的方程APFD如下: 在哪里测试用例的数量,米错误的数量,是第一个测试用例的指数,揭示了吗我错误的执行顺序T。的价值APFD从0到100%不等。自n和米是固定的任何订单,更高APFD值表明,测试过程中检测到故障前。
APFDc。当考虑故障的严重性,我们使用APFDc(28),(cost-cognizant)加权平均的比例检测故障,奖励测试用例订单比例的单位故障严重程度检测。我们假设测试用例的成本是相同的。的方程APFDc简化如下: 在哪里的严重性吗我th断层和其他符号有相同的方程的定义APFD。
4.3。案例研究设计
假设有许多智能移动设备在一个购物中心和每个设备负责自己独特的功能。我们现在需要测试其内部智能软件的功能。我们假设一个一个测试用例的测试设备,这软件功能的测试设备。
首先,它收集数据。进行比较实验,需要五个类型的数据信息,包括测试用例,水平的测试用例(设备)的错,错误的清规戒律,距离的设备,覆盖信息。
测试用例的准备,错,错误的清规戒律,覆盖率信息是微不足道的,因为它已经存在的对象系统的原始数据。的准备水平的测试用例(设备),我们年级测试用例根据他们的名称描述。移动设备之间的距离的制备要求我们给他们的价值观通过模拟智能商场的场景。
第二,它执行的测试用例优先级技术。这个实验研究实现了五个方法(TC、AC、R、端口和L-TCP)进行比较。因为一些不确定的优先级技术,每种技术运行20次为每个实验和平均值作为结果。平滑常数设置= 50%。
第三,它计算APFD和APFDc从每个技术为每个优先测试顺序。所有测量值比较在不同的技术。从这种比较结果提出了在4.4节。
所有的实验都是在同一台计算机上进行配置为64位windows 8操作系统,英特尔(R)的核心(TM) i3 - 2130 CPU和4 GB内存。
4.4。结果和分析
在本节中,我们目前的实验结果和分析其相关性高于我们的研究问题。
4.1.1。RQ1:与传统的TCP技术进行比较
图6显示框块五ChipTest的技术在所有的系统版本。横轴表示版本,每个盒子一个版本提供了一个TCP技术。纵轴的礼物APFD值。每箱线图显示了中位数,上/下四分位数,最大值/最小值APFD值通过技术来实现。
箱线图,L-TCP,如所示APFD得分,显著优于其他人,因为它的中值点达到最高。除了L-TCP,端口性能更好更高的中间点。TC、交流和R也有相似的效果,及其中值点APFD定位大约在40%至65%之间。
例如,让我们选择v-9的数据进行分析。我们使用米(中位数,第一季度,第三季)来表示中位数,第一和第三个四分位数APFD为每个技术和价值观M1- - - - - -M5表示五个技术:TC, AC, R,港口,和L-TCP分别。所以,五个技术的结果M1(38.89, 29.37, 48.02)平方米(34.13,29.37,43.25),M3 (38.1, 31.35, 46.43), M4 (45.24, 40.88, 46.83),和M5 (78.57, 78.57, 78.57)分别,这显然表明L-TCP整体性能要比其他人更好。
评估的信心水平观察到的结果,我们测试他们的统计学意义。首先,单一样本钴测试用于检查每个技术的正态分布的数据从120年开始执行(运行20×6版本)。显著性水平是= 0.05。他们的研究结果如下:在桌子上4第一行是TCP方法上面提到的名字。第二行显示了TC法官的正态分布,AC, R,港口,L-TCP。第三行显示其重要性概率值在零假设下。
从表4结果接受零假设(值都大于0.05)。所以,APFD值的5个优先级技术满足正态分布。
接下来,成对样品t以及,得到足够的统计证据。f1和f2被定义为的值APFD分别由两个优先级,优先级的方法。
以下两个假设是:H0:f1=f2,如果两种技术有相同的故障检测率的有效性。H1:f1>f2,如果f1明显好于f2。
如果p值小于显著性水平(= 0.05),我们可以拒绝零假设,接受备择假设。
表5统计测试的结果报告,通过使用数据从120年开始执行。他们的研究结果表明,L-TCP统计上显著优于其他TCP技术因为它t值大于0,值小于0.05。
例如,与TC相比,L-TCP = 0.000和它的价值t值= 22.947,所以我们可以拒绝零假设,L-TCP和TC有相同的故障检测率的有效性并接受备择假设L-TCP明显好于TC。
10/24/11。RQ2:不同评价指标的影响
在故障检测率的评价指标,APFD是不考虑故障严重性和吗APFDc认为错误的严重性。
图7显示APFD和APFDc分布在不同版本不同的技术。从图可以看出7,L-TCP最高价值观APFD和APFDc评估。也就是说,L-TCP的优先效应在其他技术中是最好的,无论是否错误的严重性被认为是在评估。此外,其他技术的趋势是相似的两种评估(版本9和11除外);也就是说,除了L-TCP港口是第二个最好的技术。在version 9,APFD评估表明,TC的影响,AC, R,港口是相似的,如图7(一)。然而,在APFDc评估,端口是明显优于其他三种技术在version 9,如图7 (b)。在版本11日APFD评估表明,港口是比其他人更好,但在评估APFDc,交流是略优于端口。
(一)
(b)
因此,从结果,是否考虑断层清规戒律中移动不会影响的结论1,也就是说,L-TCP优于其他方法。只是优秀的程度在不同的指标变化。
4.4.3。RQ3:影响因素优先级效率
从RQ1和RQ2的结果的分析,可以看出L-TCP是最好的技术来提高故障检测率。除了L-TCP,港口是第二个表现最好的技术。
深入分析表明,首先,根据测试数据的特点,L-TCP主要影响设备的位置信息的优先级效率。在智能商场场景中,位置信息是影响测试的主要因素为智能软件嵌入到移动设备的效率。第二,在智能商场场景中,港口类测试用例根据移动设备的软件功能的优先级在这个实验。设备的功能优先级决定了设备的水平,和设备的水平决定了一个测试用例的质量测试这个设备。回想起来,在智能商场场景中,测试万有引力计算模型考虑两个设备位置信息和设备水平,这是影响测试优先级效率的主要因素。所以,这可能是为什么L-TCP可以实现这个智能商场场景中更好的分类结果。
4.5。威胁的有效性
内部效度,平滑常数的选择会影响结果。在这篇文章中,该参数的选择是基于均衡,也就是说, 。进一步的调查可以研究平滑常数的影响。
外部效度的威胁的对象,其测试数据,和错误使用的实验研究。减少这种威胁的对象,我们选择的实验对象是系统测试芯片,这是一个相对较近的对象来模拟场景。此外,我们连续选择多个版本(6版)进行实验模拟分步智能商场场景的集成测试。第二个外部威胁在于这个对象的测试数据。尽管数据相对真实,是不够完整的研究。不完整的数据(比如缺乏设备)之间的距离,我们试图模拟数据补充根据场景。第三个外部威胁是缺点。对于缺点,我们使用实际故障为了更接近真实的场景。
建构效度的威胁在于测量实验结果是否正确的方法。为了减少这种威胁,首先,APFD是用来测量的有效性测试用例优先级自订单吗APFD可以测量的故障检测率和已广泛应用于测试用例优先级的评价问题。第二,APFDc也是用来测量准确的速度单位故障严重程度检测,因为它认为错误的严重性。
5。相关工作
测试用例优先级是一个有趣的研究领域近二十年。Rothermel et al。13]首先提出完整的TCP的定义问题找到一个排列的T为了最大化目标函数。他们专注于代码覆盖在代码级TCP方法(13- - - - - -16]。2001年,Elbaum为TCP指标进行具体的研究,包括APFD和APFDc [28]。APFD度量宣称所有的缺点都有相同的严重程度和所有测试用例都相等的成本。APFDc,单位故障严重程度检测单位测试成本,认为统一的测试用例的成本和故障的严重性。他们的研究主要是集中在白盒测试但不是在黑盒测试。Zhang et al。29日)认为需求优先级TCP和提出了一个算法称为TCP_RP_TC。优先级技术必须预测需求优先级和测试成本在测试套件执行之前,但在实践中预测是困难的。Chu-Ti et al。30.)提出了一个基于历史TCP方法与软件版本意识。优奇人et al。31日)设计并分析了TCP使用体重依赖型剂量GUI应用程序的方法。加戈和达塔32,33)使用测试用例优先级根据修改功能在web应用程序或数据库更改。萨哈et al。34)提出了一个完全自动化和轻量级测试优先级方法(REPiR)来解决这一问题的回归测试优先级降低标准信息检索问题这两个程序版本之间的差异形成了查询和测试构成文档集合。一些研究人员(35)关注测试用例优先级根据突变分析。它是一种有效的方法,但成本昂贵。另一个小说refactoring-based方法(RBA)提出了阿尔维斯et al。36),重新排序一个已存在的测试序列利用一组重构故障模型。它促进了早期发现重构的缺点。小王和阿里et al。37)提出了一个resource-aware多目标优化的解决方案与适应度函数定义的基于四个成本效益的措施。优先测试用例的测试位置感知服务提出了翟et al。38,39],它将在服务选择一个测试用例优先级技术测试定位web服务。
移动应用测试是测试在移动设备上的研究方向。然而,大多数的移动应用程序测试侧重于性能测试或独立的测试将移动设备的软件作为一个独立的软件。高et al。40)提供了一个通用教程在移动应用程序测试,首先检查了测试需求,然后看着目前方法都为移动设备本地应用程序和网络应用程序。Muccini、Di弗朗西斯科·埃斯波西托(41]研究新的研究方向移动应用测试自动化,通过回答三个研究问题。鉴于第一个研究问题(RQ1)移动应用程序(所以)不同于传统的,所以需要不同的新测试技术和专业?似乎,自然回答是的,它们是。关于(RQ2)有什么新的挑战和研究方向测试移动应用程序?,似乎很多的挑战,与移动应用程序的上下文和流动特性。只要关注(RQ3)这是测试移动应用程序的自动化可能扮演的角色吗?一些自动化潜力已经概述了,意识到应当进行更深入和成熟的研究。Dantas本人交出密码等。42)提出一套测试需求,引起使用广泛的研究的结果如何移动应用程序的测试过程是在文学和在实践中完成的。Morla和戴维斯43)创建一个测试环境,支持基于位置的应用程序的关键方面的评价没有广泛的资源投资所必需的一个完整的应用程序实现和部署。张和Adipat [44)提出了一个通用框架进行可用性测试移动应用程序通过讨论研究问题、方法和可用性属性。Vilkomir [45]报道的有效性评估方法选择移动设备(即。智能手机和平板电脑)来测试移动应用软件。Amalfitano et al (46)解决测试问题的手机应用程序作为事件驱动系统通过账户两个上下文事件和GUI事件。金、崔和黄(47)提出了一种方法来支持性能测试使用一个数据库在emulator-based测试环境建立了通过基准测试在单元测试水平。
6。结论
提出了一种基于位置的TCP使用万有引力定律的方法。介绍了测试万有引力结合三个因素(测试用例信息、故障信息和位置信息),优先考虑测试用例。测试用例的信息涉及到移动设备的水平。故障信息包括故障的严重程度。此外,我们使用发生故障创建一个断裂的测试用例集。它在三个步骤:获得设备集群,提取测试子集,并运行预选的测试用例。位置信息包括设备的实际位置。它是用来计算两个设备之间的三维欧氏距离。最后,通过实验验证的有效性L-TCP技术相比传统的测试用例优先级技术。
实验结果表明,中值APFD L-TCP值是78.57%,这是高于基线的值的方法。当采用成对样品t以及,L-TCPt值大于0,值小于0.05。(1)与TC,特别L-TCP = 0.000和它的价值t值= 22.947;(2)与交流,L-TCP = 0.000和它的价值t值= 21.728;(3)与RL-TCP = 0.000和它的价值t值= 25.486;(4)与港口,L-TCP = 0.000和它的价值t值= 28.295。这些结果表明,L-TCP统计上显著优于其他TCP技术,它可以检测更多的缺点比别人在同一时间消费。
当考虑故障严重程度的因素在评估,结论L-TCP优于其他技术将不会受到影响。这只是它的卓越程度不同在不同的指标。在智能商场场景中,位置信息的设备是影响优先级性能的主要因素。此外,设备的水平也很重要。
下一步是扩大范围的实证评价,试图使结论更加准确。此外,如何给一个适当的参数也是一个研究方向。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称没有利益冲突有关的出版。
确认
这项工作得到了国家自然科学基金(批准号61572306和61572306),IIOT创新和发展特殊的基础上海(批准号2017 - gyhlw - 01037),赛尔创新项目(批准号,NGII2017051和NGII20170206)。
补充材料
ChipTest数据。xlsx文件项目的数据用于我的论文的实验研究。结果。xlsx文件是我实验研究的详细结果。结果分析。xlsx文件包含的原始图表分析结果,也是我的论文所示。(补充材料)