perl – 如果给出一个输入词,我如何生成一个发音相似的单词列表

发布时间：2020-12-16 06:06:43 所属栏目：大数据来源：网络整理

导读：当你拼错谷歌中的一个单词时(例如“appples”),它会为你提供现在熟悉的“你的意思是：苹果”的建议. 根据搜索结果的相关性排除Google猜测您的意图的能力,我如何开发一个听起来相同的单词列表？这些词不一定是英语,也不一定存在.因此,举例来说,如果我给输入

当你拼错谷歌中的一个单词时(例如“appples”),它会为你提供现在熟悉的“你的意思是：苹果”的建议.

根据搜索结果的相关性排除Google猜测您的意图的能力,我如何开发一个听起来相同的单词列表？

这些词不一定是英语,也不一定存在.因此,举例来说,如果我给输入“漏洞”,我会找回一个列表,其中包括：“整体”,“hola”,“妓女”,“角色”,“磨牙”等…

我猜可能有一些在线的东西可以开发这个列表,但我找不到任何东西.如果没有站点,并且可以使用Perl完成,是否有CPAN模块可以帮助我这样做？

您可以从了解Text :: Soundex模块开始.这是一种将字映射到4字节代码的简单算法.我很久以前就把Soundex从Sedgewick(前Knuth)拿出来,用它来生成更长的键(没有被截断),并建议修正0和1个字母的替换列表.我将其应用于人口普查和邮政数据的大型数据库.

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!