eMatch: Android应用程序在你的位置寻找朋友

文摘

本文中给出的工作是双重的。我们首先概述建筑设计,功能需求,以及用户界面eMatch, Android应用程序由对抗孤独的想法启发我们都见证在大城市。eMatch已连接的目标共同利益的人,碰巧在同一地理区域。然后我们提出EgoSimilar,新的算法计算用户之间的相似性和eMatch实现。算法相比,对另外两个著名的和广泛使用的相似性计算方法和显示优于他们的在我们的研究中使用的最重要的指标。

1。介绍

大部分的社交媒体应用程序帮助人们沟通,但实际上,他们的电脑屏幕上。另一个很常见的图像在大城市,除了屏幕背后的一个人,是人的一个人坐在餐馆,咖啡馆和公共交通。因此,尽管社交网络提供了社交能力,形成“虚拟”的关系,在现实世界中人们经常一个人呆,相互远离。孤独在我们时间已经那么糟糕成为“社会病”(1]。

上述思想和观察促使我们设计和开发一个应用程序,eMatch(电子匹配),目的是填补虚拟和现实世界之间的差距。它的目的是找到一个人在同一地理区域,比较他们的利益,并建议用户可以满足的潜在的朋友。这种方法是基于事实,朋友往往有共同利益和活动,它已被证明在一些重要研究工作在人格相似性和友谊可以追溯到70年代2,3]。在本文的其余部分,当使用短语“找朋友”我们指的是有共同利益的人,喜欢和不喜欢。

eMatch,为了人民利益相比,用户利率几个默认的类别,如“电影”和“运动”,而他们可以添加和速度项其中之一。例如,一个用户可以速度类别“体育”和“7”在1到10的规模和增加这一类项目与评级“9“足球”。“基于这种类型的评级,应用程序的算法计算用户的匹配,以表明潜在的朋友。与其他方法在文献中,我们的算法,EgoSimilar,考虑项目的普及,额定的计算。

在下一节中,我们检查应用程序中的相关工作支持跟踪基于共同利益的潜在的朋友在同一地理区域。部分3分析应用程序的功能需求详细描述用例以及用户界面的基本原则和设计过程中使用的方法。我们描述的架构eMatch节4一起使用的工具。节5我们的匹配算法,EgoSimilar。节6我们提出并讨论了比较的结果当使用eMatch EgoSimilar与其他匹配算法和使用它。最后,部分7介绍了我们的工作和我们的下一个步骤的结论在改善和评估eMatch。

虽然有些eMatch相关应用程序开发(例如,4- - - - - -6])他们更关注跟踪现有的朋友在地图和减少对发现和建议的朋友共同利益基础上,位于接近地理区域。“找朋友”应用程序,特别是,这是由苹果公司目前与iOS9自动安装。Facebook也增加了使用地图定位的朋友但最终停用它出于安全原因7,8]。

两个应用程序更接近eMatch美食组的目标是应用程序(9)和Youhoo应用程序(10]。美食组应用程序旨在帮助人们有相似兴趣聚在一起在餐厅,休息室和酒吧享受食物和饮料和结合票务应用程序书席位在特定的场所和重大事件。因此,应用程序不使用用户的当前位置,而是作为一个通用的应用连接具有相同兴趣的人和促进特定的场所。Youhoo应用程序所有当前应用程序中最接近eMatch iOS和Android相关发现朋友在用户附近的一个地区。它的目标是创建圈子里的人在一个地区的共同利益。然而,Youhoo从Facebook创建概要文件;因此,用户不使用Facebook被排除在使用应用程序中,用户希望创建一个不同的配置文件或分享他们Youhoo只有特定信息配置文件不能这样做。此外,圈子里的人的共同利益由应用程序相当通用或一维,例如,学生在同一个大学,在同一领域工作的人,和球迷的一个特定的歌手。相反,eMatch计算匹配用户之间基于整个配置文件,用户希望通过此应用程序当然允许用户创建一个配置文件,它独立于任何其他应用程序。

位置信息只用于eMatch实际原因。特别是eMatch使用位置信息来定位潜在的朋友在同一地区(16公里半径是用作有关,默认克里特岛,希腊,我们最初测试应用程序)的地方,而不是在地图上追踪并揭示用户的位置和其他应用程序一样。eMatch的目标是促进潜在的朋友见面,相互介绍自己,如果他们希望。用户的位置被认为是私有和敏感信息和处理方法。为了减少安全风险,我们采取了两个措施:首先,我们提供的选择“可视性”状态下,用户的设备将无形的其他设备,即使他/她使用应用程序。这意味着“不可见”选项将隐藏用户从应用程序的匹配结果。其次,用户的利益和评级是不可见的,除了那些他/她的用户在应用程序中有指定为朋友。唯一的公共信息是所有对“可见”的匹配百分数地理区域内用户。这样,个人的隐私是保留。

3所示。功能需求和用户界面

在本节中,我们描述eMatch最基本的特性以及在用户界面设计过程中使用的方法。

3.1。功能需求

系统的功能需求如下:(1)用户注册;(2)创建和管理一个个人简介:为了把自己介绍给别人,用户创建一个个人资料。这个概要文件包含两个基本类型的信息:(一)个人信息,如名称和姓氏,专业或教育信息,或一个概要文件的照片,(b)信息用户的利益:这是基本类型的eMatch应该提供的用户信息。利益分为9个基本类别:电影,音乐,书籍,游戏,体育,科学,购物,食物,和旅游。用户率每一个这些类别根据他/她喜欢这样,在1到10的量表,1对应于恨,5到冷漠,和10去爱。随后,每九个类别之一,用户可以插入项目他们有强烈的意见(正面或负面)并相应地率。在每个类别也有默认项插入到系统中,以减轻用户的应用程序的理解和帮助他们指出他们的偏好,而无需输入自己的一切。用户可以选择部分或全部默认项或完全可以忽略他们,速度只自己的条目;(3)社交网络的创建和管理:每个用户创建一个个人社交网络,包括用户连接的人。网络的本质就像那些从其他社交网络(Facebook、Twitter等)。用户与第一学位的朋友关系,和他的朋友的朋友拥有第二学位等等。一级关系当然是形成只有两个用户同意。(4)用户的匹配:这个功能包括我们的应用程序的最终目的是潜在的朋友的建议基于最优程序应用程序的用户对他们的地理位置。匹配是基于用户评分;因此,更多的数据用户决定进入他们的个人资料关于他们的兴趣,爱好,喜欢,不喜欢,更精确的匹配结果将;(5)基于个人信息(即搜索用户。、名称、电子邮件);(6)通过个人通信与其他用户的信息;(7)个人喜好配置:此功能提供一个基本的选择是“可见”的选择和我们小节中提到的“无形”的地位2一个“无形”的地位意味着用户可以搜索潜在的朋友但是他们的个人资料将被排除在其他用户的搜索结果。

3.2。用户界面设计

在这里,我们描述的基本方法和设计原则设计用户界面。考虑的主要因素是,应用程序的目标群体是智能手机用户,他们通常没有相同级别的专业知识和教育。我们设计应用程序的考虑最坏的情况,也就是说,用户在技术方面经验不足,只有小学教育。然而,对于应用程序的正确使用是必要的,用户基本的英语知识。

下面是设计用户界面时遵循的基本规则(11]。(1)模板。模板的严格定义是至关重要的维持其余的规则和一个良好的用户界面的基础。的内容结构和期权类似于提出Android应用程序的设计者(12]。更具体地说,重点是将所有的菜单选项栏上方的屏幕上。原因是手机屏幕很小,它必须包含尽可能多的有用的信息。如图1eMatch是永久的标志放在左边的这个酒吧。点击图标时,执行行动“返回”,为了返回前一个屏幕。把标志在屏幕的左上角提醒用户哪些应用程序正在运行。那边的选择是基于实验表明,当用户看到一个页面,他们开始读/从左上角(11,13]。旁边的标志,一个文本,作为“路径”,帮助用户理解哪些功能被执行在每一个时刻。例如,当用户看到了“个人资料”屏幕,然后文本路径是“我的资料。”栏的右边角落一个图标是用作放置菜单。当点击图标,弹出窗口出现,显示所有用户的菜单选项。例如,如果用户在“个人资料”屏幕上,然后其中一个选项是“编辑感兴趣类别。”左边的菜单图标,第二个静态放置图标,切换用户的状态从“可见的”“不可见”,反之亦然。其余的屏幕,酒吧,下面是“活动区”,这是用来呈现非静态的信息。(2)通知用户。通知用户在应用程序中对概念的位置相当于提供以下两个简单问题的答案,所有用户都不管他们的经验:“我在哪里”和“到底发生了什么。”这个问题的答案“我”给出了应用程序的标志和“路径”永久放置在屏幕的顶端,告知用户使用哪个应用程序,以及在当前屏幕上的信息。这个问题的答案“发生了什么”是考虑到系统显示的信息消息每次用户完成特定的动作。(3)选择颜色。为这个特定的应用程序选择的颜色是蓝色,因为蓝色引起的安全感,信心,浓度,和独立用户(14,15]。背景颜色是淡紫色,而商标的颜色是电动蓝色为了有一个高对比度和从其他项目独特的显示在屏幕上。页面中显示的文本的颜色是黑色的,除了一些例外,颜色是灰色或蓝色,以区别于其他的文本(标签,匹配结果)。在出错的情况下使用的颜色是红色的色调为了创建危险和错误的感觉8]。(4)一致性。一致性是非常重要的在设计用户界面时(16]。整个应用程序的设计模式后,提出了以上。这可以帮助用户避免“迷失”,探索应用程序。信息是在同样的方式在所有屏幕;遵循相同的规则,当一个错误发生时,帮助用户时,当呈现非静态的信息,当显示菜单。

接下来的步骤在设计用户界面如下。(一)故事板(17]。故事板是小预定义的“故事”,执行场景,像他们的名字所示。基本上每个“故事”都对应于应遵循的步骤来完成一个应用程序的功能需求,我们选择最代表的。我们做了一个粗略的设计屏幕(每一步/屏幕,导致未来)在纸上澄清的顺序应遵循为了完成每个故事。故事板的使用和评价是非常重要的步骤在设计一个可用的应用程序,因为可用性问题可以发现即使在屏幕在纸上的简单的设计。(b)多元化的介绍(18,19]。多元化的介绍是一个方法论,真实用户评价故事板。这个应用程序开发使用广泛的用户,所以我们选择的用户对我们的评价(7)(即有广泛不同的特征。、年龄、教育程度)。另外实际用户,评价一个人专家HCI专家(人机交互)。(c)实现。当步骤完成后,我们做了必要的修改用户界面设计和转移到其实现为Android使用xml。所以,对于每一个功能要求我们设计了所有必要的xml文件,因为每一个对应于一个不同的图形界面在智能手机。

4所示。建筑设计和工具

为了eMatch等应用程序的运行,有必要使用一个中央服务器存储所有用户的数据并执行特定的算法。eMatch的体系结构分为三层,如图2。图层1从智能手机和层2和3的服务器端。每一层只与它的相邻层进行通信。

第一层。第一层包括与用户的交互,所有有用的信息提出了通过xml页面和接收。因此,任何的信息交换与用户只有通过这些页面,完成信息的管理从java类的活动。负责管理所有活动用户和应用程序之间的数据,和更具体地说,编辑,添加,读通过用户的屏幕(即动态信息。,用户名和评级)。第一层还包括服务(java类),它代表的服务不与用户互动,在后台操作。这种服务的一个例子是一个通知服务器对用户的位置以固定时间间隔。的活动和与服务器通信的服务通过HTTP请求和响应。所有服务器和移动设备之间的信息是根据JSON编码标准(20.]。

第二个层。第二层体系结构包括控制器和事件处理程序构成的主要部分应用程序的业务逻辑。事件处理程序的java类,它可以执行功能需求或其他有用的业务应用程序。控制器是一个java类处理HTTP请求和响应并触发相应的事件处理程序,应该执行的操作。

第三层。建筑的第三层包括数据访问对象(dao)和数据库存储所有必要的数据的应用程序。DAOs java类被用来与数据库通信;实际上DAOs包含适当的函数插入、删除和编辑数据库数据。事件处理程序和DAO之间的通信是通过刀转移,这是java类,只有这两个层之间传输数据。

使用这一层的优势是,它把业务逻辑的应用程序和数据库。因此,如果数据库也改变了那唯一应该改变DAOs。

开发这个应用程序使用的工具是Android xml文件,Eclipse IDE实现Java的活动,和Java服务;Netbeans IDE控制器实现java代码,事件处理程序,DAOs,和刀转移类;和MySql数据库。

5。匹配

在本节中,我们描述和讨论我们的“匹配”算法,也就是说,我们的算法计算相似性用户根据自己的兴趣和喜好。我们也在场,简单地说,另外两个广泛使用的方法来评估相似,也就是说,皮尔逊相关性和余弦函数。所有三种方法实现eMatch,为了找到潜在的朋友基于用户评分。这些算法应该从服务器端运行;他们运行在智能手机将是不经济的,以及电池和耗时,因为它经常需要通过移动互联网数据传输和许多计算执行。

匹配算法运行在服务器上,手机必须有互联网接入和至少一个位置提供者激活。它还应该存储定期(每10分钟是一个合理的间隔)用户的地理位置。

5.1。EgoSimilar

EgoSimilar是我们的算法。它考虑了以下理由:(一)匹配的是一个“自我中心”的方式,因为每个用户根据他/她自己的标准应该搜索朋友和利益。因此,两个用户之间的匹配百分数会出现在每个用户的屏幕很可能是不同的。在我们看来这是有道理的,因为在现实生活中我们的运作方式不同,选择我们周围的人主要是基于我们自己的需要和利益,不兼容我们与他们的需求。因此,如果,例如,用户有一个积极的感兴趣的类别,而用户有五个,匹配百分数()将基于一个类别,而匹配百分数()将基于所有5个,导致不同的结果显示每个用户的屏幕上。两个相似措施相比EgoSimilar将也以同样的方式计算。(b)更受欢迎的物品(受欢迎的,他们是积极的还是消极的,许多用户)不应影响匹配结果不受欢迎项目一样,如果用户“同意”。原因在于,即使用户分享,例如,一个有利的意见非常有名的乐队,书,电影,等等,这并没有真正给大量暗示他们的品味匹配。类似案件中关于相对不知名的乐队/书/电影提供了一个更为强大的共同利益。(c)的评级选择用户规模从1到10。因此最大额定值的区别将9和一个单位的重量等级差异将1/9≈0.11。这个重量应该包括,在我们看来,在计算用户之间的相似性。

其次是eMatch的步骤计算下面描述用户之间的匹配。前三个步骤之后不管匹配的计算方法,这是在步骤(4)中实现的。

让用户运行应用程序;因此,匹配是根据完成的口味:(1)检查用户的存储位置。如果不是,通知用户;去下一个步骤。(2)找到与用户密切地理相邻的用户。(3)找到所有的活跃用户兴趣类别的。(4)匹配在EgoSimilar计算如下:为每个用户发现在步骤,计算如下: 在哪里活动类别的用户的数量吗。重量是归因于一个类别的总体评价。在我们的例子中,,当我们考虑用户的“将军”匹配(例如,他们两人爱的电影),较小的重要性,因为他们在这一类特定的口味可能差别很大,甚至完全。实验与其他的值讨论了部分6。是所有个人物品的重量评级的一个类别(在我们的例子中,)。项目用户的数量吗已经插入类别。是一个函数,计算评级用户之间的绝对差吗和为激活的用户。如果用户已失效的具体类别,然后我们准备好了吗等于零。是相关的项插入由用户在th激活类别和表示评级用户之间的距离和为特定的项目。我们设置如果用户等于零没有认为这个项目;否则,计算,考虑到具体项目的普及,如下:(一)初始化用户之间的绝对差异评级和对于这个项目。(b)让是插入这个项目的用户数量,并让是插入项目的用户数量激活的用户。然后,受欢迎的重量被定义为特定的项目。如果一个项目被认为是流行,这意味着超过一半的“投票”这一类的用户插入特定项目(与消极或积极的评级)。(c) 是适应项目的普及和上面的原理解释如下。如果(和),然后。这状态,因为这个项目是受欢迎的和用户密切的评级,那么这个项目应该不会影响匹配结果不受欢迎的物品一样。因此,评级用户之间的距离和必须增加以减少匹配。这一增长是通过实现的重量,我们将讨论的价值部分6。如果(和),然后不会改变。如果(和),然后。这表明,由于这个项目是不受欢迎的和评级的用户关闭,那么这个项目应该影响匹配结果比流行的物品。因此,评级用户之间的距离和必须减少为了增加他们的匹配。这是实现再一次通过重量。如果(和),然后。同样,如果项目不受欢迎和评级的用户不近,我们推断这是表明用户没有共同利益。通过增加他们的评级的距离,他们匹配却降低了。

算法的复杂性,在那里是用户的数量,是类别的数量(在我们的例子中,9个),然后呢插入条目的最大数量的一个类别。

5.2。皮尔森相关

第二种方法计算用户的相似度,实现和测试在eMatch,皮尔森相关(21]。皮尔森相关不考虑项目普及,EgoSimilar一样。正相关关系显示了用户之间的相似之处,而一个负值表明这些用户不相似,他们的利益是不同的。下面我们描述如何计算皮尔逊相关。

让和是eMatch的两个用户。接下来的步骤以计算匹配百分比如下:(1)找到所有的活跃用户兴趣类别的和所有的东西插入每个类别和一个向量存储每个元素的评级吗(一个元素是一个类别或一个项目;一个单独的向量构造类别和另一个项目)。(2)创建一个向量有同样大小的向量。为每个元素的上一步检查用户额定。如果是,向量的对应位置分配与的评级;否则,它被赋予一个零值。(3)让向量的长度,表示向量的平均值和向量的平均值;然后匹配是计算

为了能够有意义的对比EgoSimilar皮尔逊相关性,我们计算了匹配之间的匹配类别和项目之间分别使用皮尔逊相关性,使用相同的和EgoSimilar权重(0.25,0.75)的实现。相同的权重时选择的余弦相似度(在下面描述)被用作相似性计算方法。

5.3。余弦相似度

另一个著名的相似性度量两个向量之间的余弦相似度(21]。接下来的步骤是完全相同的,如皮尔逊相关性的情况下,建设的向量。然后,匹配计算如下:

利用余弦相似性的劣势eMatch是共线向量导致100%的相似性。所以,如果评级是1的10,那么这是一个重大错误匹配的结果是100%,虽然在现实中这种情况是很少遇到。

5.4。聚类

为了检查上述算法的结果,通过知名用户被分成组——聚类算法(22),使用匹配的比例得到了三种相似度计算方法。让集群的数量,步骤的则算法如下:(一)创建初始质心,每个集群。初始化每个质心的评级为所有类别和所有不同的项目插入每个类别的用户。(b)每个用户分配给集群与最近的重心。用户和质心的距离计算,使用上述三种算法之一,作为匹配,在那里是真正的用户和是重心。(c)所有用户都分配到一个集群时,重新计算的评级重心,通过为每个元素(项目或类别)的平均评级的用户组。(d)重复步骤和直到重心的评级不再变化。

过程总是会终止,但是则不一定找到最优配置。的缺点则是其敏感性的随机初始化聚类质心;通常最初的重心应该是“远。“我们在我们的评估解决这个问题通过使用不同质心和计算平均超过10独立运行的结果。其他聚类算法也可以使用,但是他们的比较则超出了本文的范围。

6。评价

匹配算法的评价我们收集的数据来自57个用户(年龄18-40)在现实生活中谁是朋友。收集的信息包括激活/失活9的兴趣类别,所有积极的评级类别,个别项目在所有活跃的评级类别。每个类别的项目评价是新插入的用户或尽可能多的默认项的用户希望率。我们收集的数据来自57个用户。

我们之所以选择收集数据主要来自组织的朋友(不过,一些参与者没有连接到其他用户),用这种方法是可行的(一)评估的相似性计算方法是否能“发现”,通过更高的匹配值,现有的友谊(b)揭示哪些用户,目前不知道对方有可能成为朋友。

总共43的57个参与者至少有一个连接。这些总共43参与者形成64一级连接。统计所有57用户评级的平均评分值6.6,标准差2.7。这些数据暗示用户主要是他们喜欢的东西,而不是花时间国家他们的喜好是什么。我们跑的比较结果——聚类算法,每次用不同的相似度计算方法(EgoSimilar、皮尔森和余弦)。我们推导结果的集群等于3、5、7、10、分别,为了评估(如果)集群的数量如何影响用户匹配。

在表中1- - - - - -7,我们的研究结果提出了列包含在我们的研究中,所使用的指标如下:(一)id:集群id,(b)N1:用户数量的集群中,(c)N2:在集群中的用户数量(即有网络。,they are connected with at least one other user, who may be in that cluster or in another one),(d)N3:用户的数量的集群连接在现实的朋友,(e)AVC(平均有效连接):为每个用户在集群计算的比例关系,包括在特定的集群和派生的平均百分比,(f)我(平均匹配):这是所有用户的平均匹配百分数的特定的集群,(g)AMC(连接的用户平均匹配):这是所有连接用户的平均匹配百分数的集群,(h)AMnC(没有连接用户的平均匹配):这是所有用户的平均匹配百分数的集群不是连接。


	匹配的指标
	我	AMC	AMnC

EgoSimilar (= 0.1)	48.8%	56.0%	48.5%
EgoSimilar (= 0.2)	48.1%	55.3%	47.8%
EgoSimilar (= 0.3)	47.5%	54.5%	47.2%
皮尔森	8.3	11.9	8.2
余弦	68.3%	76.5%	68.0%


	放置

EgoSimilar (= 0.1)	20.12
EgoSimilar (= 0.2)	20.04
EgoSimilar (= 0.3)	19.91
皮尔森	21.40
余弦	21.77


id	每个集群匹配度量
id				AVC (%)	我(%)	AMC (%)	AMnC (%)

1	14	12	4	30.4	50.7	55.9	50.5
2	13	8	4	18.5	50.3	63.4	49.6
3	4	3	0	0.0	25.1	- - - - - -	25.1
4	22	18	8	41.7	57.6	58.3	57.6
5	4	2	0	0.0	41.9	- - - - - -	41.9
Σ	57	43	16


id	每个集群匹配度量
id				AVC (%)	我(%)	AMC (%)	AMnC (%)

1	8	7	1	9.5	30.7	33.4	30.6
2	19	14	5	32.7	53.4	55.0	53.4
3	0	0	0	- - - - - -	- - - - - -	- - - - - -	- - - - - -
4	24	17	10	36.2	52.5	64.3	52.0
5	6	5	0	0.0	56.0	- - - - - -	56.0
Σ	57	43	16


id	每个集群匹配度量
id				AVC (%)	我(%)	AMC (%)	AMnC (%)

1	9	8	2	16.4	47.7	53.1	47.5
2	2	0	- - - - - -	- - - - - -	27.7	- - - - - -	27.7
3	34	26	25	53.5	54.7	62.2	54.3
4	6	5	1	13.3	45.9	61.7	44.8
5	6	4	0	0.0	29.3	- - - - - -	29.3
Σ	57	43	28


id	每个集群匹配度量
id				AVC (%)	我	AMC	AMnC

1	22	16	6	27.8	10.1	25.5	9.7
2	6	5	1	12.9	21.3	24.7	21.1
3	13	10	3	16.5	14.6	14.6	14.6
4	6	4	0	0.0	17.0	- - - - - -	17.0
5	10	8	3	37.5	10.8	7.9	11.0
Σ	57	43	13


id	每个集群匹配度量
id				AVC (%)	我(%)	AMC (%)	AMnC (%)

1	3	2	0	0.0	47.1	- - - - - -	47.1
2	25	18	15	51.0	70.5	74.6	70.3
3	4	3	0	0.0	61.7	- - - - - -	61.7
4	12	11	6	36.4	83.8	87.2	83.5
5	13	9	1	3.7	57.9	86.6	57.5
Σ	57	43	22

考虑上述平均值和标准偏差的用户的评级,我们初始化质心的评级随机间隔4至10。皮尔森相关和余弦相似度值区间范围(乘以100能够与EgoSimilar)进行比较。然而,余弦相似性匹配值有界区间因为所有的评级价值观是积极的。匹配值EgoSimilar也有界在相同的时间间隔。表1介绍了平均每个用户和所有其他用户之间的匹配结果,之前实现聚类。

以下初步结论可以通过研究上面的结果:(1)在所有五个实现匹配连接用户之间(即高。,users who have already formed relationships with each other) than between not connected users. This result is expected and intuitively simple to understand.(2)皮尔逊相关性达到最坏的结果区分为连接和未连接的用户,通过匹配计算。AMC和AMnC之间的区别,使用EgoSimilar,无论价值的7.5%左右,使用余弦相似度是8.5%。使用皮尔逊相关性时的这种差异是3.7规模;因此,它将1.85%如果尺度归一化。因此,皮尔森相关未能“发现”,用户已经连接,一个事实根据心理学文献应该从他们的偏好,因此明显的匹配。(3)EgoSimilar导致平等AMC和皮尔森相关匹配结果,和更高的值最小的匹配结果。EgoSimilar也会导致最小的平均匹配结果未连接的用户,所有的值。此外,连接和未连接的平均匹配用户减少的时候增加。这些结果的原因是,大多数用户参加了评估决定率大部分应用程序的默认项。这使得默认项目很受欢迎,和受欢迎的项目,在EgoSimilar,可以导致减少匹配(如果用户有显著不同的意见)或没有变化。更大的降低显然更大值。这解释了明显的“严格”EgoSimilar,相比皮尔逊相关性和余弦函数措施(然而携带共线向量的问题,解释部分5)。基于观察到的行为的独立用户下载eMatch的初始版本已经可以在谷歌玩(23),我们认为这严格将减轻,尽可能多的用户更愿意进入自己的物品来代替评级违约的。

然而,应该强调,实际匹配百分数是没有价值的。唯一的实质性影响,它可能,特别是在没有连接用户,是定量比例可能更有趣的用户来决定与另一个用户交流。真正实质是“匹配用户”的顺序出现在用户的屏幕上,在减少百分比(高到低)。一个用户显然首先应考虑用户与他/她最高的匹配,不管实际匹配百分数(除非匹配百分比很低甚至为“匹配”的用户,这将是令人沮丧)。在这个匹配列表我们希望现有的朋友高。因此,评价三种相似度计算方法,我们位于每个用户的匹配列出现有的朋友被放置的位置。这项研究的结果发表在表2,他们表明,现有的最佳位置的朋友显然是通过EgoSimilar。再次的皮尔森相关展品性能比EgoSimilar可以解释如果我们考虑它评估不同的特定类别的评级/项目,相比平均用户给出的评级。这使它脆弱的时候几个甚至一个极端值是包含在被比较的评级;因此,为用户提供“局外人”的评级结果是不一致的。另一方面,余弦度量和EgoSimilar只检查当前评级每个类别/项,每个两个用户。EgoSimilar,然而,试图被使用更复杂的权重根据评价项目的普及和评定量表。出于这个原因,显示了余弦相似度来执行同样的皮尔森相似,比EgoSimilar的实现。

表3- - - - - -7现在我们的结果在使用聚类则与。每一行对应一个集群/组的用户。首先,通过比较的总和N3列,很明显,EgoSimilar算法优于皮尔逊相关方法不管价值;即,它包括在同一集群之前更多的人已经联系朋友eMatch的使用。同时,表中给出的结果3- - - - - -7表明EgoSimilar明显优于余弦度量,用N3,当= 0.3(28日和22日用户)。我们跑反复实验,对各种随机初始质心,有3种不同的值。在每种情况下至少有一个值取得更高的N3比余弦度量结果。的价值的原因实现最好的结果是不一样的在所有的情况下上述的敏感性——聚类算法的随机初始化聚类质心。如果重心充分“远”然后甚至一个小的价值足以利用为数不多的nonpopular项目,连接的用户分享感兴趣,并将连接用户在同一集群。然而,如果重心不充分“远”和用户的评分包含异常值,那么为了执行聚类相似的用户更大的价值是必要的。为了克服这个问题,一个直观简单的解决方案是使用默认的初始质心,充分的间隔。然而,这个解决方案是不现实的,因为默认的选择重心必须基于数据集,这不是静态的57参与者的数据;它的变化实时eMatch的实际用户。因此,这种方法需要不断重新计算在服务器上。因此,表中给出的结果2,无论EgoSimilar优于其他方法值,假设用户下载并运行eMatch越多不同的评级,我们使用。

最后,EgoSimilar的比较与其他两个相似度计算方法的AVC,点,AMC, AMnC指标表明,EgoSimilar比得上皮尔逊相关的所有值虽然获得较小的匹配百分比指标与余弦度量相比。皮尔森相关再次未能“发现”,用户已经连接的两个5五星团(“预付款采购保证”AMnC),如表所示6。

节5我们提到过,我们使用不同的值和在我们的实现中。正如所料,当使用较低的值(因此,较大的自)匹配百分比减少。原因是匹配的用户更容易类别”字段比物品的字段。因此,一个更小的体重类别的匹配会导致较低的整体匹配和高分别导致更高的整体匹配。指示性的整体匹配减少3 - 4%,为所有的相似度计算方法。

此外,正如前面所提到的在这一节中,我们推导结果的集群等于3、5、7、10、分别,为了评估(如果)集群的数量如何影响用户匹配。我们的研究结果表明,没有定性区分匹配结果通过改变的价值。唯一的区别是量化:对和所有方法都显示导致较小的比那些实现匹配的结果,因为1 - 2非常大的集群和几个非常小甚至空的。这是相关的,当然,这一事实的用户数量在我们的研究中(57)不是很大;因此,大量的集群是无用的。的结果目前没有实质性差异的。

然而,更重要的是,是,EgoSimilar继续超越所有的值皮尔森相关和余弦度量的N3度规。余弦度量继续提供在其集群匹配百分比最高,为连接和nonconnected用户,所有的值,而各自的皮尔森相关(归一化的结果)与EgoSimilar的。

我们还应该提到,已有多种方法被用于信息检索和协同过滤算法相关。集群技术一直用于信息检索提高搜索引擎的性能(24]。然而,使用集群技术(平衡集群、单链接聚类和组平均聚类)来提高人们的性能匹配与分层烧结的有关算法。层次聚类,然而,相比是众所周知的表现不佳在大型数据集的情况下,则由于其显著增加执行时间。因此,在大量用户同时运行eMatch,则是更好的选择。

作者在25)使用排名函数提出了一个方法,代表了人们的偏好在度量空间中,可以定义一个内核基础相似函数;然后使用聚类发现重要的组织均匀状态。作者指出皮尔逊相关性和余弦相似性的成功,使不同的用户的评价向量之间的比较;他们也用余弦相似性在他们的工作。不过,他们提出类分离技术,利用支持向量机(svm)成为计算复杂,导致他们避免使用则,以减少计算复杂度的结合——与他们的技术。相反,他们使用非参数成对算法,产生一个分为两部分的数据集分成两个集群,然后递归地进行分区机制应用于每一个产生的集群。为了确保只有有意义的分裂发生,作者利用交叉验证方法(26衡量一个索引,可以解读为显著性水平;然后,他们只接受水平高于阈值的分割。很明显从上面这个方法再一次计算起来更复杂的算法eMatch上运行。

图3提出了三个截图使用eMatch:(一)初始屏幕,(b)匹配的用户的百分比用户地理位置相近(整体匹配+之间的“最佳匹配类别”和其他用户),用户(c)的概要文件。

(一)

(b)

(c)

7所示。结论和未来的工作

我们设计并开发了一个新的移动应用程序,eMatch,目标的帮助用户找到具有相同兴趣的人在地理相邻,同时尊重用户的隐私。eMatch的想法是由一个事实,即当代的生活方式让很多人花很多时间离家,经常在陌生人。因此,这对他们来说是有意义的连接正确当场由世卫组织与亲近的人分享他们的利益。这个决定可以快速的帮助下一个聪明的应用程序,而不是决定寻找生活伴侣,这将通常需要更多的思想和研究从用户(专注于这一领域的其他应用程序)。然而,即使在家里,用户花费大量的时间使用他们的移动设备。因此,即使用户想把他们的时间和评估可能的朋友将有机会这样做。

除了提供建筑设计上的细节,功能需求,和eMatch的用户界面,我们提出了一个新的算法,EgoSimilar,计算用户之间的匹配。算法明显优于两个最著名的相似性措施,皮尔逊相关性和余弦函数,在我们的研究中使用的最重要的指标。57用户自愿参加评估算法的仔细监控,说明他们的偏好和指出现有的友谊;我们要感谢他们,因为他们有价值的帮助EgoSimilar的评估算法。

目前的工作描述的设计和评价的第一步eMatch EgoSimilar算法。我们打算扩大评估通过使用大量的用户。这是一项非常耗时的任务,因为我们需要找到大量用户与现有的友谊谁愿意使用应用程序在我们的监督下,以便进行的实验是没有错误。这项工作目前正在进行。

eMatch谷歌的第二个版本,目前做好准备,我们将允许用户选择“看到”只属于同一集群的用户或所有用户,也就是说,即使是那些与他们可能很少或根本没有共同利益。下一步我们的工作将整合eMatch语义相似度计算算法,进一步提高集群和隐式(通过匹配百分数)友好的建议。使用这种算法是很重要的,所以相关概念,名称和物品将自动链接应用程序(例如,足球和橄榄球,足球和曼联)。另外,我们计划进行纵向研究审查时,人们如何在移动的情况下找到匹配。

我们也相信eMatch可以进化,这样,另外作为一个朋友推荐系统,它将函数作为一个项目推荐系统,强烈推荐的条目的用户共享一个特定类别的高匹配百分数。

利益冲突

作者宣称没有利益冲突有关的出版。

引用

j·t·Cacioppo和w·帕特里克,孤独:人性和社会联系的必要性w·w·诺顿& Company, 2009年。
g s . w .鸭子和克雷格,“人格相似性和友谊的发展:一个纵向研究,“英国社会和临床心理学杂志》上,17卷,不。3、237 - 242年,1978页。视图:出版商的网站|谷歌学术搜索
c·沃纳和p . Parmelee”相似的活动朋友间的偏好:那些一起玩在一起,”社会心理学季刊,42卷,不。1,第66 - 62页,1979。视图:出版商的网站|谷歌学术搜索
Parashar”,附近的朋友仪,“https://play.google.com/store/apps/details?id=com.fsp.android.friendlocator。视图:谷歌学术搜索
声纳媒体公司,“声纳:附近的朋友”,https://play.google.com/store/apps/details?id=com.valez.near。
https://itunes.apple.com/us/app/find-my-friends/id466122094。
http://www.wired.com/gadgetlab/2012/06/facebook-quietly-releases-find-friends-nearby-then-quietly-pulls-it/。
http://www.dailymail.co.uk/sciencetech/article-2164366/Facebook-kills-Find-Friends-Nearby-feature-stalking-fears-GPS-app.html。
http://appcrawlr.com/android/gourmet-groups。
http://appcrawlr.com/android/youhoo。
w . o . Galitz用户界面设计的基本指南:介绍GUI设计原则和技术威利,2007。
r·迈耶专业的安卓4应用程序开发约翰·威利& Sons,纽约,纽约,美国,2012年。
c·s·坎贝尔和p . p . Maglio”,促进导航信息空间:路标在万维网上,“国际人机研究杂志》上,50卷,不。4、309 - 327年,1999页。视图:出版商的网站|谷歌学术搜索
鲁索p和s .粗野的人,“你的界面是流利?:“在设计国际用户程序交互的93和CHI 93年会议在计算系统的人为因素,页342 - 347,阿姆斯特丹,荷兰,1993年4月。视图:出版商的网站|谷歌学术搜索
t . Soen、t .岛田和m .秋田犬“颜色设计的客观评价,”色彩研究与应用,12卷,不。4、187 - 195年,1987页。视图:出版商的网站|谷歌学术搜索
c·m·布朗,人机交互设计指南,智慧书,英国布里斯托尔,1998年。
k . n . Truong g·r·海耶斯和g·d·Abowd“故事板:实证确定最佳实践和有效的指导方针,”第六届ACM会议程序设计交互系统(DIS 06年)2006年6月,页12-21 ACM,。视图:谷歌学术搜索
j·尼尔森,“可用性检查方法,”会议的程序在计算系统人为因素(CHI 94),第414 - 413页,1994年。视图:谷歌学术搜索
j·尼尔森和r . Molich“启发式评估的用户界面,”ACM SIGCHI会议程序在计算系统的人为因素ACM, 256,页249 - 1990。视图:出版商的网站|谷歌学术搜索
n . Nurseitov保尔森,r·雷诺兹和c .伊苏列塔”JSON和XML数据交换格式的比较:一个案例研究中,”学报22日计算机应用在工业和工程国际会议(凯恩' 09),页157 - 162年,旧金山,加州,美国,2009年11月。视图:谷歌学术搜索
l . Mekouar y伊拉克,r . Boutaba”同行相似的分析建议在P2P系统中,“多媒体工具和应用程序,60卷,不。2、277 - 303年,2012页。视图:出版商的网站|谷歌学术搜索
c的羊毛衫,k•瓦格斯塔夫、美国罗杰斯和s . Schrodl“约束与背景知识,k - means聚类”18学报》国际会议上机器学习(ICML ' 01)1卷,第584 - 577页,2001年。视图:谷歌学术搜索
https://play.google.com/store/apps/details?id=com.tuc.eMatch&hl=en。
m·d·邓洛普”集群技术的发展和评价寻找人,”学报》第三届国际会议上的实用角度知识管理(PAKM ' 00)巴塞尔,瑞士,2000年10月。视图:谷歌学术搜索
j . Diez j·j·德尔因为o . Luaces和a·巴哈蒙德,“聚类标准,人们根据他们的偏好”专家系统与应用程序,34卷,不。2、1274 - 1284年,2008页。视图:出版商的网站|谷歌学术搜索
美国杜诺夫,r . El-Yaniv y Gdalyahu, e . Schneidman n . Tishby g·尤纳,“成对一个新的非参数聚类算法基于迭代估计距离的概要文件,”机器学习卷,47号1、35 - 61年,2002页。视图:出版商的网站|谷歌学术搜索|Zentralblatt数学