加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

解析人名并在Ruby中匹配它们

发布时间:2020-12-17 01:48:54 所属栏目:百科 来源:网络整理
导读:我正在寻找一个宝石或项目,让我发现两个名字是同一个人.例如 J.R. Smith == John R. Smith == John Smith == John Roy Smith == Johnny Smith 我想你应该已经明白了.我知道什么都不会100%准确,但我想得到的东西至少可以处理大多数情况.我知道最后一个可能需
我正在寻找一个宝石或项目,让我发现两个名字是同一个人.例如

J.R. Smith == John R. Smith == John Smith == John Roy Smith == Johnny Smith

我想你应该已经明白了.我知道什么都不会100%准确,但我想得到的东西至少可以处理大多数情况.我知道最后一个可能需要一个昵称数据库.

解决方法

我认为一种选择是使用 Levenshtein distance的ruby实现

两个字符串之间的Levenshtein距离定义为将一个字符串转换为另一个字符串所需的最小编辑数,允许的编辑操作是单个字符的插入,删除或替换.

然后你可以定义距离小于X的名字(X是你必须调整的数字)来自同一个人.

编辑
通过一点点搜索,我能够找到另一种算法,基于名为Metaphone的语音

它还有很多漏洞,但我认为在这种情况下,每个人都可以做的最好的事情就是为你提供替代方案来测试并看看什么效果最好

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读