关系模糊聚类中提取内在的发展集群的结构关系数据,并扩展到基于模糊线性模糊聚类模型<我nl在e-formula>
关系模糊聚类的模糊聚类关系扩展揭示集群结构埋在关系数据。关系模糊<我nl在e-formula>
线性模糊聚类模型(
本文比较研究的适用性<我nl在e-formula>
本文的其余部分组织如下。节
假设我们有<我nl在e-formula>
除了逐步原型<我nl在e-formula>
这个线性聚类模型与当地PCA(有着密切的关系
当<我nl在e-formula>
RFCM [
为了修改RFCM处理非欧几里得的距离度量,海瑟薇和Bezdek [
假设<我nl在e-formula>
与固定模糊会员<我nl在e-formula>
这种线性模糊聚类模型也扩展到跨越2 d的2 d模型情况下典型的飞机使用三个medoids [
尽管非欧几里得的关系数据可能会带来负的聚类标准(
山本等<我t一个l我c>。我t一个l我c>(
一个示例程序,包括自动化<我nl在e-formula>
集<我nl在e-formula>
计算聚类标准<我nl在e-formula>
如果至少有一个对象<我nl在e-formula>
更新模糊的会员(
搜索medoids每个集群。
重复步骤
在步骤
虽然该模型在模糊聚类类别,很容易看出一个硬(non-fuzzy)版本时可以覆盖<我nl在e-formula>
海瑟薇和Bezdek [
本文认为几种归责技术的适用性FCMdd-type线性聚类。
海瑟薇和Bezdek [
三角不等式也代表如下:
还可以结合前两个归责值预测合理估计缺失值。平均的极大极小值三碘苯甲酸和极大极小三碘苯甲酸用于将缺失的元素。这个三碘苯甲酸称为平均三碘苯甲酸。
这些污名技术基于三角形不等式可以很容易地应用到关系聚类问题。在下一节中,这三种归责方法比较FCMdd-type结合线性聚类任务<我nl在e-formula>
两个实验结果显示为了考虑三个三碘苯甲酸的适用性归罪在FCMdd-type线性聚类技术<我nl在e-formula>
在以前的研究,它已被证明比“硬”“软”聚类模型的本地PCA任务(
人为关系数据集由60从2 d模式生成数据集如图
2 d绘图的人工数据集。
在先前的研究
首先,欧几里得不完全关系数据矩阵生成通过删除非对角元素的一部分<我nl在e-formula>
相比之下,那些没有聚类结果<我nl在e-formula>
集群分区的比较从关系数据估算三个三碘苯甲酸(左)/没有(右)<我nl在e-formula>
极大极小三碘苯甲酸(没有。失踪:500)
极大极小三碘苯甲酸(没有。失踪:400)
平均三碘苯甲酸(没有。失踪:500)
每个近似法<我nl在e-formula>
另一方面,没有<我nl在e-formula>
这些结果暗示FCMdd-type线性聚类可以成功地提取不完整的线性子结构欧几里得关系数据使用<我nl在e-formula>
第二,FCMdd-type线性模糊聚类应用于非欧几里得的关系数据。
不完整的关系数据矩阵生成的以同样的方式与欧几里得的情况。聚类结果是描绘在图
集群分区的比较从关系数据估算三个三碘苯甲酸(左)/没有(右)<我nl在e-formula>
极大极小三碘苯甲酸(没有。失踪:1000)
极大极小三碘苯甲酸(没有。失踪:700)
平均三碘苯甲酸(没有。失踪:1100)
与<我nl在e-formula>
没有<我nl在e-formula>
通过这种方式,<我nl在e-formula>
在第二个实验中,三碘苯甲酸归责方法相比在文档分类的任务。关系数据集生成使用日本著名小说夏目漱石“Kokoro”。小说由三章(老师和我,我和我的父母,老师和他的证明),包括36章,18岁,56个部分,分别。文本数据(日语)可以从青空银行诈骗的下载(
Document-keyword biplots [
两个关系数据矩阵生成考虑同现的10个关键字的信息。Jaccard系数和骰子系数的相似性度量信息不对称二进制变量(
2×2列联表的文本文档。
| 关键字B | |||
|---|---|---|---|
| 关键字一 | 1 | 0 | 总 |
| 1 | 一个 | b | a + b |
| 0 | c | d | c + d |
|
|
|||
| 总 | a + c | b + d | |
Jaccard的相似性系数表示为
骰子的相似性系数也表示为
因为线性聚类模型使用距离(dis-similarity)措施,相似的措施<我nl在e-formula>
应用FCMdd-based线性模糊聚类之前,随机选择从关系矩阵元素保留11772个元素,由三个三碘苯甲酸的方法估算。然后,Jaccard集群分区的索引是派生的,如图
集群分区的比较完整的“Kokoro”文本数据派生Jaccard系数估算的三个三碘苯甲酸。
极大极小三碘苯甲酸(没有。失踪:6200)
极大极小三碘苯甲酸(没有。失踪:8000)
平均三碘苯甲酸(没有。失踪:7200)
极大极小三碘苯甲酸允许缺失值为50%或更少。缺失值平均三碘苯甲酸容忍60%或更少。极大极小三碘苯甲酸导致一个好的分区缺失值为68%或更少。的参数<我nl在e-formula>
聚类结果骰子系数描述在图
集群分区的比较完整的“Kokoro”文本数据派生骰子的系数估算三个三碘苯甲酸。
极大极小三碘苯甲酸(没有。失踪:5600)
极大极小三碘苯甲酸(没有。失踪:7400)
平均三碘苯甲酸(没有。失踪:6600)
在实验中,证明了三碘苯甲酸归责方法适合不完整的非欧几里得的关系数据结合<我nl在e-formula>
最后,与其他方法进行了探讨。尽管我们已经许多聚类算法,其中一些被用于文档聚类任务(
集群分区的比较模糊<我nl在e-formula>
Jaccard(没有。失踪:8000)
骰子(没有。失踪:7400)
另一方面,该方法适用于不同的目的找到“局部线性结构”从当地主成分分析的角度,对cluster-wise有用信息汇总等当地特色地图建设。在这个意义上,该方法有不同的未来应用领域从传统的聚类工具。
本文比较了三碘苯甲酸归责方法和适用性<我nl在e-formula>
从当地PCA概念的观点,该方法可用于本地信息汇总或本地特性映射构造数据结构在低维空间中视觉上总结了结合数据聚类。应用程序仍然在未来的工作。另一个潜在的未来的工作是一个扩展到多维原型模型的情况下,这是有用的地图构建二维特性。
这项工作是支持部分由教育部,文化、体育、科技、日本,在科研补助金(23500283)。