加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

perl – 如果给出一个输入词,我如何生成一个发音相似的单词列表

发布时间:2020-12-16 06:06:43 所属栏目:大数据 来源:网络整理
导读:当你拼错谷歌中的一个单词时(例如“appples”),它会为你提供现在熟悉的“你的意思是:苹果”的建议. 根据搜索结果的相关性排除Google猜测您的意图的能力,我如何开发一个听起来相同的单词列表? 这些词不一定是英语,也不一定存在.因此,举例来说,如果我给输入
当你拼错谷歌中的一个单词时(例如“appples”),它会为你提供现在熟悉的“你的意思是:苹果”的建议.

根据搜索结果的相关性排除Google猜测您的意图的能力,我如何开发一个听起来相同的单词列表?

这些词不一定是英语,也不一定存在.因此,举例来说,如果我给输入“漏洞”,我会找回一个列表,其中包括:“整体”,“hola”,“妓女”,“角色”,“磨牙”等…

我猜可能有一些在线的东西可以开发这个列表,但我找不到任何东西.如果没有站点,并且可以使用Perl完成,是否有CPAN模块可以帮助我这样做?

解决方法

您可以从了解Text :: Soundex模块开始.这是一种将字映射到4字节代码的简单算法.我很久以前就把Soundex从Sedgewick(前Knuth)拿出来,用它来生成更长的键(没有被截断),并建议修正0和1个字母的替换列表.我将其应用于人口普查和邮政数据的大型数据库.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读