文摘
移动服务的发展,服务质量(QoS)成为一个至关重要的因素,以满足最终用户的个性化需求移动服务的非功能的性能。然而,大多数的QoS价值观在现实情况下无法实现的,因为服务用户只会调用一些特定的移动服务。因此,如何预测失踪的QoS值并推荐优质的服务最终用户在移动服务推荐研究成为一个重大的挑战。以前的QoS预测研究表明,移动服务的非功能性能密切相关用户的位置信息。然而,大多数位置感知服务质量预测方法忽略的前提下获得QoS值观察到不同的用户在同一位置区域可能是靠不住的,这将会导致不准确和不可靠的预测结果。可信的位置感知服务质量的预测,我们提出一个混合矩阵分解方法集成的位置和声誉信息(LRMF)预测难以实现QoS的值。我们的方法首先集群用户到不同区位地区根据自己的地理分布,然后我们计算用户的声誉来识别不可靠的用户在每个位置上的地区。最后,可以预测未知的QoS值通过整合集群区位信息和用户的声誉为混合矩阵分解模型。综合实验是进行公共QoS数据集包含足够的实际服务调用记录。评价结果表明,我们的LRMF方法可以有效地减少不可靠的用户的QoS的影响预测和可靠的移动服务的建议。
1。介绍
基于移动应用开发技术的灵活性和可扩展性,数以万计的混合移动服务中提供类似的功能已经开发和移动应用程序商店。然而,这种现象会导致信息过载自动移动服务检索系统的问题。应对这一挑战,服务质量(QoS)用于面向服务的系统分析移动服务的非功能性能(1- - - - - -4]。QoS已广泛应用在服务选择,组成,建议研究[5- - - - - -9]。在实际服务调用场景中,用户只会搜索并选择一些特定的不可预知的互联网环境下移动服务。很多未知的移动服务,让用户调用它们中的每一个是不切实际的和评估他们的功能性性能。因此,如何作出准确的QoS预测未知移动服务是一个关键的步骤,使优质服务推荐移动服务计算模式。
协同过滤(CF)被广泛使用在大多数电子商务推荐系统来预测小姐等级值。传统的CF模型通常分为两类:基于内存和基于模型。基于内存的CF的QoS预测过程通常会找到类似的用户为目标用户的一个子集,推荐高质量的移动服务共享的这些相似用户到目标用户10]。基于模型的方法将训练模型通过学习用户的历史QoS性能,然后预测未知的移动服务的QoS值(11,12]。虽然在QoS的CF模型被证明是有效的预测在不同的移动服务,预测精度仍不满意,因为本身的问题。
为了减少本身的影响问题,引入更多的上下文信息QoS QoS值预测模型极大地受到一些环境因素(例如,位置分布,调用时间,等等)在互联网上。在此基础上实现,位置感知的CF模型提出了预测未知的QoS服务推荐值(13]。我们都知道,不同的用户在一个位置区域通常共享同一组IT基础设施和他们会遭受类似的互联网使用经验时调用移动服务,据报道在工作的14),QoS性能与用户的位置信息密切相关。在图1我们给服务调用的一个例子,位置信息。如前所述,用户1将会有类似的QoS记录与其他用户(如响应时间)在美国;与此同时,用户与其他用户共享类似的QoS记录5月2日在印度时引起服务,如YouTube, Twitter,等等。
以前的位置感知CF方法通常计算相似度的所有不同的用户在一个特定的位置区域寻找目标用户(大部分Top-K相似的邻居12,15]。然而,一些不可靠的用户提交靠不住的QoS值将会轻率地包括在附近设置。不可靠的用户将随机提供一些QoS的能见度值或更好的改善自己的服务和为他人的差值应用程序(16]。那些靠不住的QoS值对预测精度有显著的负面影响。因此,有必要引入可用QoS的可信度值在预测过程中提高预测精度和说服力的服务推荐机制。
基于上面的实现,混合矩阵分解算法通过整合用户的声誉和区位信息预测难以实现QoS值。补充之前的服务推荐方法只采用可用QoS的价值观,我们的研究倾向于使可信和准确的QoS预测移动服务建议通过考虑不同的用户的QoS使用经验的声誉。然后我们利用个人地理距离和QoS值找到区位相似社区和发现潜在目标用户之间的连通性和他/她的邻居。与此同时,我们使用用户的声誉的重量控制用户的潜在功能学习。最后,这些约束是集成到矩阵分解模型进行可靠的个性化QoS的预测。以下贡献本文实现了:(1)我们首先集群用户到不同区位地区根据自己的地理分布和设计迭代的方法来计算用户的信誉分数由他们提供QoS使用数据。然后值得信赖的一个子集用户在每个位置上的地区可以发现分数排名的声誉。(2)在下一步中,可以发现一个值得信赖的社区将用户的位置分布和声誉的分数。通过整合的潜在特性可用QoS价值观和共享的社区,提出了一种混合矩阵分解模型制作高质素QoS的预测。(3)公共QoS数据集上进行的实验的结果表明,通过考虑数据的可信度,我们的方法可以达到较高的预测精度比其他先前的研究涉及可用QoS的靠不住的影响值。
本文的其余部分组织如下:部分2介绍了相关的研究;部分3显示我们的方法的基本原理;部分4阐述了如何设计我们的方法;部分5讨论了实验和结果分析;最后,部分6总结了纸和吸引未来的研究。
2。相关工作
2.1。服务计算算法
QoS在面向服务的体系结构中起着控制作用,特别是在服务发现和建议的研究。摩苏尔和艾哈迈迪17首先计算用户的偏好QoS历史数据,然后提出了一个服务发现方法,排名用户的QoS参数。科里提科斯和Plexousakis18)提取的上下文信息的QoS的服务描述文件和设计的服务发现方法。罗萨里奥et al。19]提出软概率合约QoS参数组合web服务和验证他们的方法在扭矩工具比其他先前的研究显示其突出表现。哈达et al。20.)提出了一个web服务组合框架利用事务属性和QoS的价值观。这个框架组合大量的现有web服务到一个工作流,可以满足用户的偏好非功能性需求。然而,这些方法只进行了合成实验数据集和缺乏真实性在实际服务调用。
2.2。协同过滤
协同过滤是一种常见的算法采用很多推荐系统,如著名的亚马逊(商业系统21]。基于内存的协同过滤方法做出预测和建议通过计算用户的相似度或物品21,22]。这些方法利用整个user-item矩阵作为输入数据,这需要大量的时间和内存空间的在线推荐系统。基于模型的协同过滤方法通常会训练一个预定义的模型可用数据和预测缺失值的测试数据集,然后选择适当的项目作为目标用户(候选人名单23,24]。基于模型的方法可以快速学习模型不需要对运行时和内存空间,也会采用在线推荐系统。
矩阵分解模型已经广泛采用许多在线推荐系统的有效性和效率。Mnih和Salakhutdinov11]介绍了矩阵分解的数学理论在概率分析和验证了该方法的性能在一个著名的电影推荐系统。Zhang et al。25)设计了一种个性化推荐方法通过集成与约束项原始矩阵分解的从他们的个人信息。它标识用户到不同的集群用户行为的统计数据在不同的标签和考虑这个约束的正则化项矩阵分解模型提高预测精度。马等。26)提高了矩阵分解方法与用户的社交信息社会建议提高预测精度。这种方法使用用户的社会关系作为额外的约束可以反映用户的潜在利益判断user-item矩阵分解的物品。最近,矩阵分解方法被广泛引入服务推荐研究10,15]。尽管矩阵分解方法做出一些改善预测精度,没有人意识到QoS可信度值得认真考虑。
2.3。基于QoS的预测
位置信息是近年来广泛用于服务的建议。阿里和索利斯(27)提出了一种新颖的分布式服务架构,能够适应网络拓扑资源和位置的变化。魏et al。15]首先计算用户的相似度与现实的距离,然后聚集用户地理集的约束项矩阵分解生成位置感知服务质量的预测方法。唐et al。28在QoS)解决了稀疏问题意识到服务推荐通过集成协同过滤用户的地理数据。李等人。29日采用偏好传播通过用户在同一位置区域来提高预测精度。这项工作分成不同组的用户和服务集群区位信息,然后使用偏好传播计算不同的用户和服务之间的相似度,分别。最后,介绍了矩阵分解模型来预测失踪QoS值通过整合这些约束。Gonsalves和帕蒂尔(30.)利用用户的位置信息和QoS值集群用户和web服务,然后提出了一个CF算法使个性化的web服务的建议。它首先使用皮尔逊相关系数(PCC)来识别不同的用户和服务区域,然后利用再邻居(资讯)和支持向量机(SVM)在CF算法框架来预测失踪QoS的价值观。然而,以上研究不考虑用户的声誉,和忽视这一事实提供QoS值可能是靠不住的,即使这些值在同一位置地区由用户提供。
2.4。声誉
基于声誉的成就应用程序(例如,YouTube和Twitter),以避免可能的欺诈风险,一些学者引入声誉QoS预测提高面向服务计算的可靠性。声誉值评估从QoS数据可以衡量是否可用的QoS值是可信的。邱et al。31日]设计了QoS预测方法通过计算用户的信誉服务推荐获得更高的精度。在工作中,不同用户的声誉将计算和排名的子集不可靠的用户。紧随其后,基于内存的协同过滤模型结合的名声QoS预测变得更加显著。根据邱的工作,徐et al。32]提出了一种改进的QoS预测方法与用户的声誉(RMF),介绍了用户的声誉影响矩阵的分解方法使QoS预测未知的服务,然后目标用户推荐高质量的服务。Mehdi et al。33]介绍了随机的方法来评估服务的声誉通过利用不同的QoS指标之间的关联信息。Comi et al。34)提出了一个混合服务组合方法利用用户的QoS的声誉,帮助用户发现和multicloud环境中选择高质量的服务。然而,这些研究不考虑位置信息的QoS的预测。
3所示。原则和声誉分析
在本节中,我们将介绍主要原则LRMF方法开始,然后声誉分析在不同的用户。
3.1。LRMF原理
前CF-based QoS预测方法(例如,7,35)只利用协同过滤模型中可用的QoS值使个性化服务的建议。然而,这些方法忽略用户的声誉和位置将对预测结果的影响。因此,我们设计一个新的移动服务推荐系统通过考虑用户的声誉和位置信息预测失踪QoS值。提出了图2、历史调用QoS和位置数据将提交服务器数据库的服务调用过程。然后,声誉和位置信息可以通过收集到的历史数据集QoS计算,最后,我们可以预测失踪QoS值和声誉和位置信息。LRMF是证明的主要工作流程如下:(1)源调用记录将被收集和提交到数据库中,当用户调用不同的移动服务。(2)在数据预处理,可用的历史QoS价值观和提取用户的位置信息作为输入数据的方法。(3)基于可用的QoS的值和位置数据,用户的信誉分数可以通过迭代法和位置计算区域也可以被他们的实际位置分布。然后,用户在不同的位置区域的可信度评估。(4)提出了一种混合矩阵分解模型通过整合位置分组和用户的声誉来预测失踪QoS的值未知的移动服务。(5)最后,通过结合预测结果和QoS可用数据,高质量的服务将被发现并推荐给目标用户。
3.2。用户声誉分析
为了识别不可靠的用户在一个特定的地理区域,我们分析从用户的QoS值服务调用历史记录。图3演示了用户的响应时间在同一地区(即。,the United States in this example) of three randomly selected services from the real-world QoS dataset [36]。作为一个示范,图4描述了100随机选择服务的响应时间由5随机选择调用用户在同一地区。
图3显示服务调用之间的不同用户的响应时间,甚至在同一位置。尽管大多数的响应时间属于正常范围值,即:,[0, 2], some users still submit outlier QoS records when they invoke services. It is unlikely that a QoS item would deviate from the normal value too much. For a specific user, if most QoS values significantly deviated from the normal range, he/she is probably an unreliable user. In order to test whether there are some unreliable users or not, we analyse the QoS data submitted by 5 randomly selected users on 100 services.
这显然是在图4用户4是一个不可靠的用户因为他所有的提交值大大偏离正常范围(0,2)。在此基础上分析,我们可以计算用户他过去的QoS的声誉价值记录和衡量这些用户是否应该被视为不可靠的用户。在后续步骤中,算法计算用户的声誉将会详细介绍。
4所示。基于位置和混合矩阵分解的声誉
我们将首先介绍这一部分原始矩阵分解的方法,然后提出改进的矩阵分解模型。
4.1。矩阵分解的预测
矩阵分解利用稀疏矩阵的低秩近似符合用户和项目。原始稀疏矩阵因式分解成两个低秩矩阵与小数量的因素。这种分解是基于QoS的假设用户的潜在的偏好值将一些潜在的影响因素。然后一个目标函数可以定义为原始值和预测误差值之和进行的两个低秩矩阵。
我们假设有一个QoS矩阵行和服务中,用户和两个低秩矩阵的列代表特定于用户的特性和特定于服务的特性,分别。QoS矩阵可以被看作是一个产品低秩矩阵和矩阵乘法的大约如下: 在哪里和 。 是潜在的数量因素。
然后,目标函数可以通过最小化误差之和为在原始矩阵可用值和相应的预期值矩阵 : 在哪里代表可用的QoS值由用户提供在服务 ; 表示行 ; 是列的 。然而,可用的QoS值是有限的在实际调用场景中,因此可以定义一个最优的目标函数来解决这个问题: 在哪里表明QoS的值由用户提供在服务是未知的,否则。介绍两种正则化条件方程(3),以避免过度拟合的问题如下: 在哪里弗罗贝尼乌斯是常态。方程(4)是矩阵分解方法的目标函数最小化之间的平方误差预测值和原始值。采用梯度的算法来训练我们的模型,并得到一个局部最小值(4)如下:
4.2。区位分组
在本部分中,我们确定了不同用户的实际位置来获取用户的一个子集地理相似与目标用户。自从位置信息显著影响QoS,它应该考虑QoS(预测的一个重要因素13]。我们计算用户的物理距离生成位置区域。用户之间的欧氏距离在可以计算如下定义: 在哪里和代表用户的经度和纬度在现实世界中,分别。学位的单位转换成二维表,一个常数值。在我们的研究中,将于111261年的价值。
生成的地理区域,那么可以选择一组用户和小的距离计算方程(7)。一方面,这个集合的大小不能太小;否则,太多类似的用户将被过滤。另一方面,它不能太大;否则不会正确地认识到不同的位置。为目标用户 ,该地区可以定义如下: 在哪里是一个积极的区位变量阈值影响区域大小,然后呢表示用户的子集与用户在同一地理区域 。在这里,我们使用(即现实世界的距离。,distance based on longitude and latitude) other than the country-level type (i.e., differentiate users based on their countries).
4.3。声誉算法
我们首先给出一个定义用户的信誉分数 。如果用户获得更高的声誉得分,他/她可以被认为是一个可靠的用户。然后我们提出迭代和合并的方法来计算不同用户的信誉分数: 在哪里是迭代和代表了阻尼因子在[0,1],是声誉迭代的用户 , 是用户引起的服务,代表平均价值的服务 ,和表示用户调用服务 。每个用户被认为是值得信赖的,声誉将分配一个初始值为1的第一步迭代。
从上面的讨论,很明显,这是一个迭代过程来计算用户的声誉。计算每个用户的信誉得分之间的差异可用QoS原始矩阵中的值和QoS的平均价值在所有引起目标用户所提供的服务。
4.4。QoS预测基于位置和声誉
方法在前一节中是原始矩阵分解方法来预测QoS值调用历史记录。充分利用用户的位置数据和否定得分,提出了一种高性能混合矩阵分解方法如下: 在参数表示用户的信誉分数 。先前的研究使QoS预测基于用户的前提遭受类似的服务调用和观察类似QoS使用经验(15,28]。然而,也有一些不可靠的用户将提供不可靠的QoS价值观和做不好的影响预测结果。因此,我们引入在方程(10)来调节不同用户的信誉。与此同时,用户的位置信息应该引入我们的方法来提高预测精度上一节中提到的。因此,区位约束项的定义如下: 在哪里表示的相对比例位置分组,代表用户的潜在因素 , 代表用户接近用户的子集 ,和代表用户之间的相似性和用户 ,定义为 在哪里真实的用户之间的距离吗和用户 ,计算方程(7)。
目标函数的梯度部分方程(10)可以计算采用梯度下降法和 :
基于更新过程的方程(5)和(6),我们可以更新和两个微分方程(13)和(14),直到我们得到目标函数方程的局部最小值(10)。
5。实验
5.1。实验设置
进行了一系列的实验在一个知名的公众QoS数据集,这是之前提供的相关工作(7]。数据集包含1974675个服务调用的响应时间记录,这是5825年收集到的339个用户服务。图5显示所有值的分布数据集和近90%的响应时间值范围(0,2)。服务调用来模拟一个真实的场景中,几个响应时间记录的值是随机生成随机不可靠的用户,和不同数量的不可靠的用户将引入到数据集研究用户的声誉对预测精度的影响。
5.2。评价指标
在实验中,我们利用两个著名的统计指标,即。,mean absolute error (MAE) and root mean squared error (RMSE) to evaluate our predicted result. If the prediction result is closer to the actual QoS value, the smaller value of MAE and RMSE will be generated and higher prediction accuracy can be achieved. MAE is given by 和RMSE计算如下: 在哪里代表原始矩阵的QoS提供价值,表示预测QoS价值,代表未知的QoS的数量值。
5.3。比较研究
用后CF方法相比,提出的方法是:(我)UPCC。这种方法利用PCC计算用户之间的相似度(37]。在服务计算研究,这种方法可以用来预测QoS的价值观。(2)联合国政府间气候变化专门委员会。这种方法是一种常见的商业建议方法。服务推荐系统通常使用这种方法来计算服务相似,使预测(38]。(3)UIPCC。UPCC和联合国政府间气候变化专门委员会都是采用同步预测框架(39]。(iv)及。这种方法利用概率理论来解释如何使用矩阵分解使预测(11]。(v)LBR1。这种方法预测QoS值结合地理信息和矩阵分解的方法15]。(vi)说明了。可用这种方法利用QoS值来计算用户的声誉,并采用矩阵分解模型来预测失踪QoS值未知的服务(32]。
模拟服务调用的情况下,一组元素的数量从原来的QoS矩阵中删除。这些数据进行预处理后,最终的密度矩阵设置为5%,10%,15%,和20%,分别。的参数设置0.1来计算用户的声誉。我们还设置 ,维数= 50, 。不可靠的用户的数量等于10约2.79的所有用户。整体比较详细介绍了表1和2。
比较结果的表1和2表明,该LRMF比其他的方法可以达到较高的预测精度,这表明QoS LRMF大大地提高了预测精度。根据比较结果,LRMF能达到最佳的预测性能。
5.4。不可靠的用户的影响
不可靠的用户的数量决定了不可靠的QoS值的训练数据集,该预测方法将产生很大的影响。在实验中,不可靠的用户设置的数量从10到80年80年和矩阵维数条件下的密度在5%,10%,15%,和20%,分别。
如图6美和RMSE值LRMF时小得多的矩阵密度变得密集的在不同条件下。它也可以证明,更多的可用的QoS值将更好地预测结果。当不可靠的用户的数量变化的范围[80],梅和RSME不增加,这表明我们LRMF方法可以减少不可靠的用户产生的负面影响,提高QoS预测精度。
(一)
(b)
5.5。参数的影响
的参数确定位置区域的比例因子方法。首先,太大的价值将创建一个强有力的预测精度之间的关系和地理区域;另一方面,如果过小,位置分配地区为目标函数不能产生足够的贡献。的比较研究介绍了维数= 50和矩阵的条件密度在5%和20%。同时,我们加10不可靠的用户实验设置。实验的细节呈现在图7。
(一)
(b)
(c)
(d)
如数据所示7(一)和7 (b),美可以实现最低的时候达到一定值10−3当比这个特定值更小或更大,美会剧烈波动。它在数据是相似的7 (c)和7 (d),RMSE将达到一定阈值时增加到10−2在开始,但它会增加阈值后略。分析表明,用户的位置数据将使一个了不起的LRMF对预测精度的影响。
5.6。参数的影响
位置集团在LRMF阈值决定了地理区域的大小。如果分配太小,该地区将是非常小的,用户在该地区会有一个很短的距离。如果分配太大,更多的用户将被识别到相同的地理区域,这将导致更多的噪声数据和忽视当地的因素。
研究参数影响预测的方法,维度的价值分配50矩阵密度条件下的10%和30%。我们还增加10不可靠的用户实验设置。
图8说明了参数影响预测的准确性。很明显,当参数评估值降低首先增加,但两种评估值逐渐增加,当参数通过一个阈值。观察到的现象可以被认为是当参数小于一定值,位置地区缺乏足够的相似用户的活跃用户,防止群众贡献他们的集体智慧。当参数分配到一个较大的值,太多的噪音数据将包含在位置区域。两种情况都将产生负面影响的预测副牧师的职务。
(一)
(b)
5.7。密度的影响
研究矩阵密度有什么影响预测结果,我们添加10不可靠的用户和组维度和50当分配矩阵密度从5%降至20%。
如图9美和RMSE减少首先当矩阵密度增加。然后,曲线变得平坦,当矩阵密度持续增加。这些比较细节表明,稀疏的原始数据对预测精度有很大的影响。如果更多的额外可用的条目,该方法可以得到更好的预测结果。这个观察表明,当最初的稀疏矩阵密度通过收集更多的QoS值,预测精度可以极大地增强了我们的方法。
(一)
(b)
5.8。维度的影响
潜在的特征向量的个数是由维度LRMF方法。我们改变维度从10到100的情况下矩阵密度在5%和10和30不可靠的用户,分别进行比较实验。
图10显示一个合适的维度的价值可以得到更好的预测结果我们可以得到一个最小预测误差。美和RMSE减少首先因为更多的潜在因素加入分解过程。维度立交桥某一阈值时,更多的噪声数据可能纳入培训模型过度拟合问题。结果,分配阈值模型的维数约80。
(一)
(b)
6。结论和未来的研究
基于这样一个前提:移动服务用户的声誉会影响未知的QoS预测,本文提出一种有效的预测方法,同时探索用户的声誉和地理分布,使个性化服务的建议。我们首先集群服务用户分成不同区位的现实世界的地理信息,然后通过历史QoS值计算他们的声誉。最后,提出了一种混合矩阵分解模型通过整合用户的声誉和地理数据来预测未知的QoS的价值观。实验分析公共QoS数据集演示了我们LRMF QoS的高性能和有效性的预测。分析表明,有一些不可靠的使用在某些位置区域和他们提交靠不住的QoS值以获得利益为自己的服务。移动服务推荐的方法在本研究提出可以降低穷人的影响不可靠的用户和推荐高质量和可靠的移动服务终端用户。
在本文中,我们只考虑用户的信息作为一个重要问题来预测未知的QoS值移动服务的建议。事实上,服务也提供有用的设施的地理分布,确定用户的位置区域根据用户和服务之间的距离。因此,潜在的设计更准确位置分组模型结合用户和服务的位置信息。此外,如果用户的算法计算声誉有缺陷,那么我们将试图引入智能方法,例如,深度学习,强化学习设计最佳的QoS预测算法。此外,用户的可靠性可能会影响到他们的信任的朋友,我们将继续跟踪用户在他们的社交网络优质服务的建议在我们的未来的工作。
数据可用性
实数数据WS-DREAM用于支持本研究的结果包括在本文中。
的利益冲突
作者宣称没有利益冲突。
确认
这项研究是由中国国家自然科学基金(6167060382和6167060382号),新的学术幼苗培养和探索创新项目(没有。[2017]5789 - 21),和中国奖学金委员会(没有。201706050085)。