偏好挖掘使用邻域粗糙集模型在两个宇宙

文摘

偏好挖掘在电子商务中扮演着重要的角色和视频网站提高用户满意度和忠诚度。一些经典方法不适用于当用户或项目本身的问题是新的。在本文中,我们提出一种新的模型,称为参数邻域粗糙集两个宇宙(NRSTU)来描述用户和项目的数据结构。此外,附近的下近似算子用于定义规则的偏好。然后,我们为用户提供对推荐项目通过使用这些规则。最后,我们给一个实验性的例子显示的细节NRSTU-based偏好挖掘本身问题。模型的参数进行了讨论。实验结果表明,该方法提供了一个有效的解决方案偏好挖掘。特别是NRSTU提高推荐精度约19%相比,传统的方法。

1。介绍

近年来,电子零售商和内容提供商提供一个巨大的选择的产品。它让用户混淆在决策在各种产品(本文称为项目),如书籍、音乐和电影。匹配的消费者提供最合适的产品是很重要的在提高用户满意度和忠诚度。

许多研究人员提出了不同的解决方案发现偏好的用户和项目之间的关系。最流行的这类技术是协同过滤(CF) [1]。CF的有两个主要领域:社区方法和潜在因素模型。一个基于用户的社区(2)方法评估用户的偏好通过分析历史评级数据这个用户的邻居也有类似的味道。类似的味道通常是解释这些用户额定最相同的物品。项目的邻居喜欢然后推荐给用户,他/她可能也喜欢它们。潜在因素模型(3)建立了一个二维矩阵来描述用户和项目的关系。矩阵中的元素是由用户给出的评级。因此,偏好挖掘问题转化为问题矩阵完成。然而,古典CF-based方法不能工作时遇到了一个新的用户从不率项(4]。事实上,即使是一些长期用户从来没有认为任何物品。很难推荐一个项目因为没有任何历史评级信息这些用户促进个性化推荐。关键的原因是,CF方法只依赖于评级历史数据。这个问题可以被称为本身的内在局限性CF (4]。

处理本身的问题(5),史肯et al。6)开发了一种组合方法推荐项目,还没有人认为。Bobadilla et al。7)提出了改进协同过滤来减轻新用户本身的问题。基于内容的过滤方法(8,9也研究了本身的问题。然而,大多数的研究人员解决本身的问题,用户或项目是新的。情况与新用户和新项目已经很少被认为是(4]。应对本身问题,当用户和项目是新的,最小值和朱4开创一个预热将推荐粗糙集方法对新形势下基于two-universe模型(RSTU)。首先,作者认为用户的特点和项目,如年龄、性别、和价格形成equivalence-based信息颗粒。然后他们使用粗糙集理论中的近似算子的定义用户和项目之间产生关联规则。这个granule-based推荐模型不仅依赖于评级数据。它可以更好地处理本身的问题。然而,一些问题(4)仍需研究。例如,equivalence-based信息颗粒仅适合处理名义数据,如男性或女性,好或坏。如果属性是数值,如物品的价格,我们必须采用离散化技术将nonnominal名义,这将不可避免地带来损失的信息。这显然是不合理的措施相似或不同与欧氏距离分类属性的数值方法。此外,通常的计分方法包含5鳞片,而作者。(4)只考虑用户是否有评价一部电影。,用户将被标记为“喜欢”如果他评价一个项目。这意味着用户,低分数给了一个项目,可以被视为一个崇拜者的项目。事实上,他不喜欢的项目因为低分。的主要原因是没有评估关于用户的评级基线(4]。这也是无法区分之间的积极的和消极的规则的结果。

因此,到目前为止,一些工作在这个领域成功地举办个性化推荐的承诺,因为下面的问题:(1)本身问题;(2)损失由离散化的信息;(3)积极的和消极的规则之间没有区别。

针对以上问题,本文的贡献包括以下:我们构造参数邻域粗糙集模型在两个宇宙。通过社区用户和项目描述颗粒。它可以克服信息的离散化数据的损失。评级表分为积极的映射和消极的映射为基础通过评级基线。附近的下近似算子用于定义规则的偏好。然后,我们可以积极的意思是“像偏好规则。“一些负面偏好规则也开采被视为“不喜欢。”方法提出了基于社区优先规则。本身的问题可以解决。实验结果表明,我们的模型提供了一个有效的解决方案偏好挖掘。

本文的组织结构如下:部分2简要回顾了相关工作本身问题和粗糙集理论在两个宇宙。节3,一些基本概念邻域粗糙集模型单一宇宙和粒状computing-based偏好挖掘简要回顾。节4数据模型和方法对基线评估调查。节5,我们建议参数邻域粗糙集模型在两个宇宙(NRSTU)。部分6显示了应用程序的NRSTU偏好规则挖掘和推荐。数值实验报告部分7。最后,部分8总结了纸。

2.1。本身的问题

在实际的推荐系统中,用户通常由五个数字的分数(现在他们的兴趣10]。CF-based方法是基于假设用户有类似rating-behaviors被组合在一起互相帮助潜在的项目中做出选择。然而,CF-based方法不可用,因为本身的问题。它发生在评级的推荐系统是短暂的。我们可以区分三种本身的问题:只有新用户,新项目,新用户和新项目(7]。

2.1.1。新用户(11- - - - - -13]

新用户意味着我们面临着用户从来没有任何物品。新用户很难获得的首选物品因为没有可用的使用信息可以使用个性化推荐(10]。改进CF-based方法如CF-content或CF-demographic共同战略来应对新用户问题(7]。例如,Braunhofer旨在解决本身问题,使用各种上下文标记评级数据集(14]。梁等人提出了一种新的基于内容的混合方法,利用横向校正关联规则集成内容的信息域项目(15]。安提出了一种新的启发式名为皮普的相似性度量,专注于改善建议新用户条件下(16]。前的所有方法都是基于假设用户是新的。事实上,可能也会有很多新项目在实际的推荐系统。

2.1.2。新项目(17,18]

新项目问题出现了,因为新项目没有初始评级。新项目不可能推荐以来没有任何评级信息促进个性化推荐。最简单的解决办法是鼓励激励用户负责评级系统中的每个新项目(7]。此外,作者(19)研究的价值甚至几评级预测能力方面。Cremonesi等人提出了两种不同的方法来构建混合协作内容推荐系统克服新项目问题[5]。头n个Elbadrawy和Karypis提出了一个基于功能的相似性模型推荐的新项目20.]。总之,新项目问题[21是更容易解决。

2.1.3。新用户和新项目

新用户或新项目的问题是单独解决。然而,这种情况与新用户和新项目很少被考虑。很难推荐新用户一个新项,因为当前用户和项目的历史数据是未知的。粗糙集模型到目前为止是最好的方法来处理这种情况。分钟和朱研究了预热将问题通过使用两个宇宙的粗糙集模型。它们提供了一种用于描述用户和项目通过信息颗粒,用户和项目之间生成关联规则的一种手段,并可向用户推荐项目使用这些规则[4]。Min和朱详细解释关于颗粒关联规则的概念(22]。然后,提出了基于粗糙集的方法解决新用户和新项目问题通过扩展最小工作(23,24]。

2.2。粗糙集模型在两个宇宙

粗糙集理论(25pswlak],提出的1982年,是一个功能强大的数学方法研究不完整或不精确的信息。这一理论已经成功地应用于许多领域,如数据挖掘、决策、模式识别、机器学习、智能控制(26- - - - - -29日]。

pswlak近似算子定义的等价关系的宇宙。宇宙的等价关系形成一个分区。分区或等价关系仍然是限制对于许多应用程序。为了解决这个问题,林首先提出社区理论的系统(30.- - - - - -32]。宽容的了解社区是由林教授指出,社区理论的粗糙集可以被看作是一个突破。朱教授研究了covering-based粗糙集(33,34]。他给的定义最小覆盖。这是一个关键问题,以减少冗余信息的数据挖掘。朱调查covering-based粗糙集的基本概念之间的关系。这个优秀的研究有助于我们更好地理解covering-based粗糙集。邻域粗糙集和cover-based粗糙集都是有意义的扩展等效关系。

大多数的研究一直在进行的假设相同的宇宙(26- - - - - -29日]。然而,two-universe模型更适合偏好挖掘问题。一般来说,对于一个特定的用户,他或她可能年级的许多项目。同时,它还可以包括许多项目被一些用户在实际的推荐系统。一个有效的方法来描述这个问题是使用两个不同的世界。宇宙是所有用户的集合。另一个是所有项目的集合。一些结果一直在粗糙集理论中生成两个宇宙。在[35),作者做了一个总体框架的two-universe基于粗糙集模型。沈和可变精度粗糙集模型定义了一个基于pswlak经典模型,下近似和上近似被推广到两个宇宙[36]。概率粗糙集两个宇宙的概念首先是由龚和太阳37]。在[38),作者关注的属性概率粗糙集两个宇宙。

以前的研究都是两个宇宙pswlak扩展的粗糙集模型。pswlak equivalence-based信息颗粒在粗糙集不适合处理数值数据。这意味着我们必须采用离散化技术将nonnominal名义数值属性。方法提出的强度在于附近颗粒的能力,以避免数据的离散化的新用户和新项目的问题。

3所示。初步

在本节中,我们首先回顾粒度计算的模型视图中的偏好挖掘,提出了在4,39]。然后,经典的邻域粗糙集模型单一宇宙也回顾了。

3.1。偏好挖掘视图的细粒度的计算

定义1(见[40])。知识表示是通过实现信息系统()这是一个表格形式,类似于数据库。一个信息系统是对表象意识到通过信息系统()这是一个表格形式,类似于数据库。一个信息系统,在那里是一个非空的有限集合的对象和是一个非空的有限集的属性。

定义2(见[40])。一个等效颗粒可以定义如下: 在一个信息系统,颗粒恰逢一个概念,这是一个基本单位的人类思想理解为一对[内涵和外延41]。
粗糙集理论(25pswlak],提出的1982年,是一个功能强大的数学方法研究不完整或不精确的信息。这一理论已经成功地应用于许多领域,如数据挖掘、决策、模式识别、机器学习、智能控制。下面的定义,在粗糙集理论中定义,是受雇于Min和朱39]。

定义3(见[42])。让和是两个非空的组对象。集值映射是宇宙人吗来。然后,被称为广义近似空间,在哪里和有两个信息系统。
这个数据模型可以被称为two-universe模型。在偏好挖掘方法39),可以考虑为用户和的设置吗是项目的集合关系的两个实体连接在哪里。

定义4。考虑到一般近似空间的一个子集,我们定义的上下近似在空间上分别如下。上面的细粒度的计算模型被称为经典粗糙集模型在两个宇宙。

定义5(见[39])。细粒度的偏好规则是一个形式的含义在粗糙集的观点39),上近似的定义用于描述偏好规则的地方被替换的子集。细粒度的偏好规则可以被用户喜欢的物品。

3.2。邻域粗糙集在单一的宇宙

前面几节描述了,经典粗糙集模型数据集数值时不可用。胡锦涛等人介绍了邻域粗糙集模型(43异构数据,以避免离散化。作者认为,单一的数据模型是宇宙。然后,我们将给邻域粗糙集模型的基本概念单一的宇宙。

定义6(见[43])。 是一个非空的有限集合的对象和是一个给定的距离函数。我们说是一个邻居近似空间在哪里(1) ,当且仅当,;(2) ;(3) 。

定义7(见[43])。给定一个附近近似空间,,我们说是一个附近的是谁的中心和半径是,在那里。

在这里,可以被看作是邻居的颗粒。

备注(见[840])。给定两个点和在维欧几里得空间,他们可以计算的距离在哪里

定义(见[943])。给定一个附近近似空间,对于任何子集,我们定义的上下近似在空间上分别如下。显然,古典邻域粗糙集模型单宇宙不适合user-item数据模式的结构。

4所示。数据模型和基线评估

4.1。数据模型

在这项研究中,我们说明了电影推荐利用MovieLens [44)广泛应用于许多偏好挖掘研究(例如,4,10,39])。我们使用的版本943个用户和1682部电影。因此,电影在这个研究项目。数据库模式是遵循。(我)用户:。(2)电影:。

根据定义1和3,和的一组用户和电影。一组和分别是用户和电影的特性。可以在表中找到具体的信息3和4节7。

最初的评级数据包含显示在表5鳞片1。文献[4)只考虑用户是否有评价一部电影。也就是说,它可以建立映射关系从u_13 m_219因为u_13额定m_219。集值映射的一个例子是在表2。然后我们可以从这种类型的我的一些偏好规则映射关系。


用户	电影	评级	基线

u_230	m_280	4.0	2.8
u_13	m_219	1.0	2.3


用户	电影	裁判(4]	我们的研究

u_230	m_280	1	1
u_13	m_219	1	0


ID	发布年	类型

m_192	1980年	戏剧
m_861	1986年	恐怖
m_1140	1994年	喜剧
m_1165	1996年	喜剧、戏剧
m_1641	1995年	纪录片
m_1680	1998年	戏剧性、浪漫
m_280	1996年	戏剧性、浪漫
m_219	1984年	恐怖


ID	年龄	性别	占领

u_13	47	男性	教育家
u_32	28	女	学生
u_44	26	男性	技术员
u_936	26	男性	其他
u_937	48	男性	教育家
u_940	32	男性	管理员
u_230	28	女	学生

事实上,1.0点意味着在所有概率不喜欢m_219 u_13。换句话说,一些这样的规则是负面的规则。“负面”这个词的含义是“不喜欢”。显然,这种类型的映射关系不合理。因此,如何建立适当的映射关系从用户偏好挖掘电影是一个关键问题。

4.2。基线评估

评级基线会捕捉用户的基本情绪一项(3]。在这项研究中,它可以被视为一个用户喜欢一部电影如果他(她)给一个更高的分数比他(她)的基线。最简单的计算方法基线是电影的总体平均评级。例如,平均评级所有电影都是3.7星。用户Joe可以被视为一个崇拜者的电影《阿凡达》,如果他给了阿凡达4.0分。然而,作者(3,45建议用户和项目偏差存在于真正的评级系统。例如,一些用户经常给比别人更高的评级。同样,一些物品总是接受比别人更高的评级。也就是说,评级基线应该是个性化的。因此,我们使用基线评估方法(45]。用户的评级基线的电影为用户账户和项目偏差的影响。

总体平均评级。的参数和显示用户的愤怒的偏见和项目,分别。我们也使用这个例子对《阿凡达》解释的意义。比平均电影《阿凡达》更受欢迎,所以它往往是额定0.5星高于平均水平。另一方面,乔是一个关键用户,他们倾向于0.1星率低于平均水平。因此,基线估计为《阿凡达》的评级将4.1星乔计算3.7−0.1 + 0.5。这意味着乔《阿凡达》可能不感兴趣,如果他给了阿凡达4.0分。

为了估计和一个人可以解决最小二乘问题(1,3,45]:

在这里,是所有的训练样本。第一项努力找到的年代,适合给定的评级。正则化项避免过度拟合的惩罚参数的大小。然后,我们可以把导数和。

因此,采用梯度下降学习算法(1,3,45]。

的参数在这项研究中被设置为0.003。因此,,,可以使用上面的公式计算。

我们使用这个基线评价方法构建两个宇宙之间的映射关系。一个用户可以被看作是一个崇拜者的电影如果他给评级高于基线的电影。第四列在表中1显示了基线的估计结果。那么集值映射第四列在表重建2。

5。邻域粗糙集模型在两个宇宙

在本节中,我们构建的邻域粗糙集模型在两个宇宙(NRSTU)。

定义10。让和是两个非空的有限宇宙。是一个附近的是谁的中心。集值映射是宇宙人吗来在哪里。然后,我们有对象集如果。因此,被称为社区近似空间两个宇宙。
元素的集合在吗被映射的。

定义11。给定一个附近近似空间两个宇宙和,上下近似可以被定义为边界地区,积极的地区,和消极的区域可以被定义为

定理12。让在邻域粗糙集两个宇宙。对于任何,考虑到两个正数和,如果,一个

证明。 和:我们有。假设,我们有。因此,我们必须有如果。然而,是不确定的如果我们有。因此,。
和:我们有。假设,我们有。因此,我们必须有如果。然而,是不确定的如果我们有。因此,。

在实际环境中,社区上近似描述用户的偏好是不够的。例如,我们需要知道有多少粒用户喜欢的物品。在这里,我们提出了一种参数两个宇宙邻域粗糙集模型是集的基数。

定义13。让参数附近近似空间上两个宇宙。对于任何,。的上下近似与和如下。附近,我们提出了一种可变精度粗糙集模型在先前的研究46]。在这项研究中,覆盖程度的来。这并不意味着一个近似的精度。这就是为什么我们称之为模型参数邻域粗糙集,而不是可变精度粗糙集。

定义14。让附近是可变精度近似空间两个宇宙。对于任何社区的不确定性被定义为计算近似空间的不确定性

6。偏好规则和建议

在本节中,我们首先定义偏好规则使用邻域粗糙集模型在两个宇宙。建议的方法也详细讨论。

6.1。偏好规则

分钟已制定的优先规则的等效颗粒(4]。在我们的研究中,我们定义了一个社区粒状偏好规则通过扩展最小的工作。

定义15。给定一个附近近似空间两个宇宙和,。一个社区颗粒优先规则可以描述如下。制定与上近似的定义是一致的11。在一个信息系统,颗粒是人类思想的一个基本单位41]。在常规推荐系统中,如CF方法,社区的含义是,相似的人有相似的兴趣45]。因此,社区上近似的定义可以被一些类似的用户像类似的物品。
规则通常是评估通过两项措施,即支持度和信心度,定义良好的(47单一的宇宙模型。two-universe模型中,用户和项目的支持度的规则,分别。另一方面,项目的比例就越高用户喜欢也表明,偏好规则更强。因此,我们也使用第三个措施称为信心程度较强的规则挖掘。因此,参数在参数邻域粗糙集模型可以作为规则的信心程度。这就是为什么我们建议参数定义邻域粗糙集模型13。优先规则的制定是参数重新定义了通过使用较低的近似邻域粗糙集模型。这里,附近低近似用于偏好的定义规则。这种类型的规则可以被解读为“用户像至少的物品”。在我们的研究中,我们只考虑的情况描述的用户和项目的所有功能。
一个简单的偏好规则挖掘算法给出的算法1这两个步骤。

输入,,,
输出所有规则满足给定的约束条件
找到所有用户附近的颗粒在哪里
找到所有项目附近颗粒在哪里
为每一个在
为每一个在
如果
输出的规则
如果
结束了
结束了

步骤1。搜索所有附近颗粒会议用户颗粒的最小支持度阈值的方法和。这一步对应线1和2的算法和分别代表用户颗粒和颗粒项。

步骤2。检查所有可能的规则有关和和输出有效的。这一步对应第3行通过算法的第9行。

6.2。优先规则的建议

推荐方法是来自邻居们有相同的品味。给定一个优先规则和一个新用户,我们建议项目如果是一个邻居。

推荐系统的性能评价主要是通过推荐精度(4]。正式,让推荐项的数量并适当数量的建议;精度是(4]。在我们的研究中,适当的建议可以推荐的条目的解释,真正的得分高于用户的评价基准。接下来我们将精心制作的详细的实验。

7所示。实验

在本节中,我们将通过实验评估我们的模型。在这项研究中,偏好挖掘的方法改善了如下两个方面。(1)NRSTU提出克服本身的问题。(2)NRSTU增强偏好挖掘的有效性通过避免离散化和分积极的和消极的规则。

我们设计三个实验来验证以上两点。首先,我们给一个实验性的例子显示的细节NRSTU-based偏好挖掘。它阐述了如何通过使用NRSTU解决本身的问题。然后,我们将讨论我们的模型的参数通过实验分析。比较NRSTU的有效性,我们选择经典粗糙集模型在两个宇宙(RSTU)作为基准。RSTU用于(4,39]因为偏好挖掘。我们下载的离散样本(48)由最小的预处理(39]。这个实验叫做NRSTU与RSTU。

7.1。社区优先规则的意义和建议

首先,我们来看一些规则从MovieLens数据集挖掘算法1。设置如下:和。比例训练样本和测试样本的比例分别为90%和10%,分别。我们可以得到很多积极的规则形式用户标记为“喜欢看电影。”同样,从用户获得一些消极的规则也不喜欢那些电影。下面列出了其中的一些例子。

一些积极的偏好规则如下:(1) 。(2) 。(3) 。(4) 。

一些消极的偏好规则如下:(5) 。(6) 。(7) 。

如表3和4,我们使用8电影和7用户阐述社区优先规则的意义。例如,意味着用户喜欢的电影。它可以解释大约28岁的女学生喜欢标签戏剧和浪漫的电影。然后,我们可以通过使用附近的电影推荐给其他用户偏好规则的算法2。假设u_230是一个新用户没有额定的任何电影。古典CF-based方法不能工作,如果我们不知道任何u_230历史评级数据的。我们可以得到她的注册信息。然后我们就会知道她是一个女学生。因此,我们可以推荐这部电影因为m_280 m_280她。事实上,由用户u_230 m_280得分4.0分的基线u_230电影280是2.8(见表1)。这意味着用户u_230 m_280很喜欢看电影。在这里,我们说这是一个适当的建议。

输入测试用户,所有规则
输出测试用户的建议
对于每一个测试用户
对于每个规则
如果是一个邻居
推荐为。
如果
结束了
结束了

另一方面,我们的方法也矿山一些负面偏好规则可以解决这个问题(4,39]。作者只考虑是否用户评级的电影。用户将被标记为“喜欢”如果他认为电影。这意味着用户,谁给电影低分数,可以被视为一个崇拜者的电影。也就是说,负规则的偏好,,将被视为积极的优先规则的观点(4,39]。例如,如表1节3,假设u_13 u_937的邻居是一个新用户。将推荐电影m_219 u_13因为m_219。事实上,由用户u_13 m_219得分1.0点的基线u_13电影219是2.3。这意味着用户u_13,男性教育家和47岁,不喜欢恐怖片。显然这是一个不正确的建议。这个实验展示了基线评估在偏好挖掘的重要一步

7.2。参数的讨论

在我们的模型中有四个参数。他们是邻居规,自信程度、支持程度,,分别。文献[43)解释说,如果阈值结果是最优的在附近设置在0.1和0.2之间的系统。在我们的研究中,阈值设置为0.15。然后,选择,,通过一系列的实验了。我们设置从0.02到0.12,0.02步因为我们不能得到任何的规则。我们的信心程度从0.05到1.0,0.05步骤。MovieLens数据集,我们随机将样本划分为10个子集,并使用它们作为训练集,其余的9个作为测试集。经过十轮,我们计算出平均推荐准确性作为最终的性能。

根据实验数据,我们可以得到一些有用的结论。首先,数字1- - - - - -6显示最高的推荐精度总是从45%降至50%在大多数情况下。当我们增加的数值从0.45到0.55,与此同时减少了规则的数量。然而,和适当的建议总不显著降低在这个区间内。规则的数量将下降到0%。然后不再有任何的建议。也就是说,我们可以获得推荐精度最高的规则更少。另一方面,总数量和适当的建议没有显著减少在大多数情况下。它可以得出结论,一些偏好规则冗余被设置在。事实上,我们只是需要更多的建议和推荐精度最高的使用规则的最小数量。在这个角度看,信心是一个具有成本效益的选择学位。

(一)信心程度

(b)的信心程度

(一)信心程度

(b)的信心程度

(一)信心程度

(b)的信心程度

(一)信心程度

(b)的信心程度

(一)信心程度

(b)的信心程度

(一)信心程度

(b)的信心程度

的支持程度和,他们只影响的规则和建议的数量显示在图1 (b),2 (b),3 (b),4 (b),5 (b),6 (b)。推荐精度无关和。很明显,支持程度越高我们越少的规则和建议我们可以得到。然而,支持程度高意味着强烈的偏好规则。因此,它是更合理的根据实际需求设置支持度。这取决于哪一个更强的偏好之间必要的规则和更实际的推荐系统的建议。我们甚至可以设置不同的值和按目的地。因此,它就变成了一个开放式的问题。

7.3。NRSTU与RSTU

在本节中,我们选择RSTU [4作为基准。在[4),作者提出了一个预热将推荐的方法通过使用经典粗糙集模型参数。NRSTU和RSTU之间的主要区别是由等价关系结构的颗粒(4)而不是邻里关系。这意味着用户(或项目)可以分为一个颗粒如果他们的功能是相同的。事实上,很少有完全一样的特性,因为数值特征,比如年龄和释放。因此,必须采用离散化技术将nonnominal名义,这将不可避免地带来损失的信息。在这个实验中,设置如下:和。

随机推荐,准确率接近6.2%,说明进行比较(4]。如表所示5NRSTU产生更好的性能比RSTU明显和随机推荐。特别是,NRSTU提高推荐精度19%。有两个原因解释。第一个原因是RSTU合理与欧氏距离度量相似或不同类别属性的数值方法。胡锦涛et al。(43)指出,至少有两个类别的结构在离散化:社区结构和秩序结构在现实空间。例如,我们知道样本之间的距离,我们可以得到样品接近彼此在现实空间。NRSTU地址这一缺陷附近的颗粒结构。此外,没有积极的和消极的规则之间的区别在4]。它由RSTU顺向给一些不合理的建议已在第一个实验中讨论。由此可见,NRSTU更有效处理偏好挖掘的问题。


	NRSTU	RSTU

规则	97508.6	14260.2
总推荐	3804.7	854.1
适当的推荐	1744.6	223.6
推荐的准确性	45.85%	26.17%

8。结论和未来的工作

在这项研究中,我们提出了参数邻域粗糙集模型在两个宇宙偏好挖掘的问题。首先分析了基线评估,划分的积极的和消极的映射。此外,社区的定义提出了下近似定义用户偏好规则。算法对偏好规则挖掘和项建议。实验阐述了NRSTU如何克服本身的问题。它同时表明,基线评估可以避免一些不合理的建议。NRSTU的参数进行了详细的实验。最后的实验表明,NRSTU提高推荐精度19%。它可以得出结论,NRSTU更有效处理偏好挖掘的问题。

未来的工作可以沿两个方向。首先,许多其他粗糙集模型还可以用来描述用户偏好规则,如内核粗糙集和模糊粗糙集。关于这些粗糙集的有效性比较分析模式偏好挖掘是一个重要的问题。第二,我们的模型来处理大数据的应用是必要的。因此,分配框架内NRSTU的版本需要进一步关注。

相互竞争的利益

作者宣称没有利益冲突有关的出版。

引用

y科伦,”与时间动态协同过滤,”ACM的通信,53卷,不。4、89 - 97年,2010页。视图:出版商的网站|谷歌学术搜索
j . Wang a·p·d·弗里斯和m . j . Reinders”统一的基于用户和基于项目的协同过滤方法的相似性融合,”学报》第29届国际市立图书馆年会在信息检索的研究与开发,(SIGIR 06年)西雅图,页501 - 508年,洗,美国,2006年8月。视图:出版商的网站|谷歌学术搜索
y科伦,罗伯特b . c . Volinsky“推荐系统,矩阵分解技术”电脑,42卷,不。8日,30-37,2009页。视图:出版商的网站|谷歌学术搜索
f . Min和w·朱”,通过颗粒本身推荐关联规则”,https://arxiv.org/abs/1305.1372。视图:谷歌学术搜索
p . Cremonesi r . Turrin, f . Airoldi“混合算法推荐新产品,”第二届国际研讨会信息Hetero-Geneity和融合在推荐系统(HetRec 11),页33-40、芝加哥、生病,美国,2011年10月。视图:出版商的网站|谷歌学术搜索
ai史肯,a . Popescul l·h·安格和d . m . Pennock”本身的推荐方法和指标,”学报》第25届国际市立图书馆会议在信息检索的研究和开发(" 02)ACM,页253 - 260年,坦佩雷,芬兰,2002年8月。视图:谷歌学术搜索
答:Hernando j . Bobadilla f·奥尔特加,j .伯纳尔”的协同过滤方法减轻新用户冷启动问题,“以知识为基础的系统26卷,第238 - 225页,2012年。视图:出版商的网站|谷歌学术搜索
r·j·穆尼和l·罗伊“基于内容的书推荐使用文本分类学习,”第五届ACM学报》会议上数字图书馆(DL ' 00)ACM, 204,页195 - 2000。视图:出版商的网站|谷歌学术搜索
m . j . Pazzani和d . Billsus“基于内容的推荐系统,”自适应网络a, p . Brusilovsky Kobsa, w . Nejdl Eds。卷,4321在计算机科学的课堂讲稿施普林格,页325 - 341年,柏林,德国,2007年。视图:出版商的网站|谷歌学术搜索
黄永发。苏,B.-W。王,彭译葶。萧,v . s .曾“个性化rough-set-based建议通过集成多个内容和协作信息,“信息科学,卷180,不。1,第131 - 113页,2010。视图:出版商的网站|谷歌学术搜索
a . m .拉希德。艾伯特,d . Cosley et al .,“了解你:学习新用户首选项在推荐系统中,”学报》国际会议智能用户接口(IUI ' 02),页127 - 134年,旧金山,加州,美国,2002年1月。视图:出版商的网站|谷歌学术搜索
a . m .拉希德·g·Karypis, j . Riedl”学习偏好推荐系统的新用户:一个信息理论方法,”ACM SIGKDD探索通讯,10卷,不。2、90 - 100年,2008页。视图:出版商的网站|谷歌学术搜索
p . du Boucher-Ryan和d桥,“协作推荐使用正式的概念分析,”以知识为基础的系统,19卷,不。5,309 - 315年,2006页。视图:出版商的网站|谷歌学术搜索
m . Braunhofer”杂交技术的预热将上下文感知推荐系统,”学报》第八届ACM会议推荐系统(RecSys 14)ACM,页405 - 408年,福斯特城,加州,美国,2014年10月。视图:出版商的网站|谷歌学术搜索
c . W.-K。梁,张炳扬。陈,F.-L。钟,”一个横向校正的实证研究关联规则挖掘方法本身的建议,“以知识为基础的系统,21卷,不。7,515 - 529年,2008页。视图:出版商的网站|谷歌学术搜索
h·j·安,”一个新的相似性测度协同过滤缓解新用户本身的问题,“信息科学,卷178,不。1,37-51,2008页。视图:出版商的网站|谷歌学术搜索
S.-T。公园和w·楚“成对偏爱回归本身建议,”第三届ACM学报》会议上推荐系统(RecSys ' 09)2009年,ACM第21至28页。。视图:出版商的网站|谷歌学术搜索
Y.-J。公园和a . Tuzhilin“长尾的推荐系统,如何利用”第二届ACM国际会议上推荐系统(RecSys ' 08)2008年10月,页11到18门,。视图:出版商的网站|谷歌学术搜索
即Pilaszy和d . Tikk推荐新的电影:甚至一些评级比元数据,更有价值”第三届ACM学报》会议上推荐系统(RecSys ' 09)ACM,页93 - 100年,纽约,纽约,美国,2009年10月。视图:出版商的网站|谷歌学术搜索
a . Elbadrawy和g . Karypis基于功能的相似性模型头n个推荐的新项目,明尼苏达大学计算机科学系明尼阿波利斯,明尼苏达州,美国,2013年。
d .太阳,z罗,f·张,“协同过滤的新方法来缓解新项目本身的问题,”学报11日通信和信息技术国际研讨会(ISCIT 11)2011年10月,页402 - 406。视图:出版商的网站|谷歌学术搜索
f . Min和w·朱”,细粒度的关联规则挖掘通过参数粗糙集冷启动建议,“https://arxiv.org/abs/1210.0065。视图:谷歌学术搜索
x他、f . Min和w·朱”参数与应用粗糙集的关联规则挖掘,”数学问题在工程文章ID 461363卷,2013年,13页,2013。视图:出版商的网站|谷歌学术搜索
H.-R。张f . Min, x, y y。许,“混合推荐系统基于user-recommender互动。”数学问题在工程ID 145636条,卷。2015年,11页,2015年。视图:出版商的网站|谷歌学术搜索
pswlak z,“粗糙集”,国际计算机和信息科学杂志》上,11卷,不。5,341 - 356年,1982页。视图:出版商的网站|谷歌学术搜索|MathSciNet
问:h . Hu d . r . Yu x和z谢,“社区分类器,”专家系统与应用程序,34卷,不。2、866 - 876年,2008页。视图:出版商的网站|谷歌学术搜索
k . j . Tang她、f . Min和w·朱”matroidal粗糙集理论方法。”理论计算机科学卷,471年,页1 - 11,2013。视图:出版商的网站|谷歌学术搜索|MathSciNet
S.-Y。京”,混合遗传算法的特征子集选择在粗糙集理论中,“软计算,18卷,不。7,1373 - 1382年,2014页。视图:出版商的网站|谷歌学术搜索
她郑胜耀京和k,“粗糙集用户偏好建模方法”粗糙集和知识技术:第五国际会议,RSKT 2010年,北京,中国,2010年10月15 - 17日,。诉讼卷,6401在计算机科学的课堂讲稿施普林格,页344 - 352年,柏林,德国,2010年。视图:出版商的网站|谷歌学术搜索
t y林”,细粒度的计算:从粗糙集和社区系统信息造粒和计算的话说,“欧洲国会程序和软计算智能技术亚琛,页1602 - 1606年,德国,1997年9月。视图:谷歌学术搜索
t . y .林,”社区系统和数据库和知识库系统的近似,”诉讼的第四届国际研讨会上方法的智能系统(ISMIS 89)1989年10月,页75 - 86。视图:谷歌学术搜索
t . y .林社区系统:一个定性和模糊粗糙集理论加州大学伯克利分校,加州伯克利分校,美国,2007年。
w·朱”关系在covering-based粗糙集的基本概念中,“信息科学,卷179,不。14日,第2486 - 2478页,2009年。视图:出版商的网站|谷歌学术搜索|MathSciNet
w·朱”之间的关系基于二元关系和覆盖广义粗糙集,“信息科学,卷179,不。3、210 - 225年,2009页。视图:出版商的网站|谷歌学术搜索|MathSciNet
d . w .贝聿铭和Z.-B。徐:“粗糙集模型在两个宇宙,“国际杂志的通用系统,33卷,不。5,569 - 581年,2004页。视图:出版商的网站|谷歌学术搜索|MathSciNet
y沈f·王,“可变精度粗糙集模型在两个宇宙和它的属性,“软计算,15卷,不。3、557 - 567年,2011页。视图:出版商的网站|谷歌学术搜索
Z.-T。龚和B.-Z。太阳,“概率粗糙集模型在不同宇宙和它的应用程序,”学报》第七届国际会议在机器学习和控制论(ICMLC ' 08)2008年7月,页561 - 565。视图:出版商的网站|谷歌学术搜索
w·m·马和太阳,“概率粗糙集两个宇宙和粗糙熵,”国际期刊的近似推理,53卷,不。4、608 - 619年,2012页。视图:出版商的网站|谷歌学术搜索|MathSciNet
f . Min和w·朱颗粒通过参数关联规则ing粗糙集。”大脑的信息卷,7670年,第331 - 320页,2012年。视图:谷歌学术搜索
美国Jing, k .她和阿里,“一个普遍的邻里粗糙集模型对知识发现不完整的异构数据,”专家系统,30卷,不。1,第96 - 89页,2013。视图:出版商的网站|谷歌学术搜索
x y姚明和邓小平,“概念学习的细粒度的计算范例,”智能创新、系统和技术13卷,第326 - 307页,2013年。视图:出版商的网站|谷歌学术搜索
w·马和太阳,“概率粗糙集两个宇宙和粗糙熵,”国际期刊的近似推理,53卷,不。4、608 - 619年,2012页。视图:出版商的网站|谷歌学术搜索|MathSciNet
问:胡锦涛,j·刘,吴和c, d . Yu”基于邻域粗糙集的异构特征子集的选择。”信息科学,卷178,不。18日,第3594 - 3577页,2008年。视图:出版商的网站|谷歌学术搜索|MathSciNet
GroupLens,http://movielens.umn.edu。
y科伦,”分解符合社区:一个多方面的协同过滤模型,”第14届ACM SIGKDD学报》国际会议上知识发现和数据挖掘(KDD ' 08),页426 - 434,拉斯维加斯,内华达州,美国,2008年8月。视图:出版商的网站|谷歌学术搜索
她k曾庆红和k,“可变精度邻域粗糙集两个宇宙,”《IEEE国际会议上细粒度的计算(GrC的13)IEEE,页418 - 422年,北京,中国,2013年12月。视图:出版商的网站|谷歌学术搜索
r . Srikant和r . Agrawal量化关联规则挖掘在很大关系表”,SIGMOD记录(ACM特殊利益集团管理的数据),25卷,不。2、1 - 12,1996页。视图:谷歌学术搜索
分钟,http://grc.fjzs.edu.cn/ ~ fmin / index . html。