哈希相似性
发布时间:2020-12-14 05:14:31 所属栏目:大数据 来源:网络整理
导读:通常,散列的目标是将连续函数转换为离散函数:输入中的微小变化应该会导致输出发生很大变化.但是,是否有任何散列算法(粗略地说)会为类似输入返回相似但(仍然不同)的散列值? (使用它的一个例子是通过检查它们的哈希值是否相似来检查两个文件是否“相似”.当
通常,散列的目标是将连续函数转换为离散函数:输入中的微小变化应该会导致输出发生很大变化.但是,是否有任何散列算法(粗略地说)会为类似输入返回相似但(仍然不同)的散列值?
(使用它的一个例子是通过检查它们的哈希值是否相似来检查两个文件是否“相似”.当然,一些失败总是可以接受的.) 解决方法
看看
Locality Sensitive Hashing(LSH).例如,这是一种在给定的一个附近快速找到一堆点的概率方法.
(编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |