加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

算法 – 是否有一种根据Jaccard相似性聚类图的有效方法?

发布时间:2020-12-14 05:16:28 所属栏目:大数据 来源:网络整理
导读:是否有一种使用Jaccard相似性在图中聚类节点的有效方法,使得每个聚类至少具有K个节点? 节点i和j之间的Jaccard相似性:设S是i的邻居集合,T是j的邻居集合.然后i和j之间的相似性由|(S?T)|给出/ |(S?T)|. 解决方法 您是否尝试过自己实施某些算法? 计算所有成对
是否有一种使用Jaccard相似性在图中聚类节点的有效方法,使得每个聚类至少具有K个节点?

节点i和j之间的Jaccard相似性:设S是i的邻居集合,T是j的邻居集合.然后i和j之间的相似性由|(S?T)|给出/ |(S?T)|.

解决方法

您是否尝试过自己实施某些算法?

计算所有成对的非零相似性(即当它们至少有一个相邻的邻居时;这使得候选集远小于平方矩阵).

按相似性对它们进行排序,并以降低的相似性处理对.最初,每个对象都是自己的集群.

当A和B尚未在同一个集群中,并且任一集群的成员少于k个时,请加入这两个集群.重复,直到处理完所有相似之处.

请注意,您可能仍然拥有少于k个成员的群集.例如,如果您的数据集总数少于k个节点,或者存在未连接的小子图等.

你真的应该接受少于k个节点的集群,即非集群节点.为什么一切都会聚集?实际数据中总会存在异常值和噪声.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读