算法 – 是否有一种根据Jaccard相似性聚类图的有效方法?
发布时间:2020-12-14 05:16:28 所属栏目:大数据 来源:网络整理
导读:是否有一种使用Jaccard相似性在图中聚类节点的有效方法,使得每个聚类至少具有K个节点? 节点i和j之间的Jaccard相似性:设S是i的邻居集合,T是j的邻居集合.然后i和j之间的相似性由|(S?T)|给出/ |(S?T)|. 解决方法 您是否尝试过自己实施某些算法? 计算所有成对
是否有一种使用Jaccard相似性在图中聚类节点的有效方法,使得每个聚类至少具有K个节点?
节点i和j之间的Jaccard相似性:设S是i的邻居集合,T是j的邻居集合.然后i和j之间的相似性由|(S?T)|给出/ |(S?T)|. 解决方法
您是否尝试过自己实施某些算法?
计算所有成对的非零相似性(即当它们至少有一个相邻的邻居时;这使得候选集远小于平方矩阵). 按相似性对它们进行排序,并以降低的相似性处理对.最初,每个对象都是自己的集群. 当A和B尚未在同一个集群中,并且任一集群的成员少于k个时,请加入这两个集群.重复,直到处理完所有相似之处. 请注意,您可能仍然拥有少于k个成员的群集.例如,如果您的数据集总数少于k个节点,或者存在未连接的小子图等. 你真的应该接受少于k个节点的集群,即非集群节点.为什么一切都会聚集?实际数据中总会存在异常值和噪声. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |