加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

用于文本比较的Perl模块

发布时间:2020-12-16 06:26:06 所属栏目:大数据 来源:网络整理
导读:任何人都可以建议一个Perl模块,它可以比较两个字符串并返回它们匹配的程度吗?我广泛搜索CPAN,虽然有像String :: Approx和Data :: Compare这样的类似模块,但它们并不是我想要的.假设我有两个字符串:我爱你,我爱你.我想要比较这两个字符串的功能,考虑到许多
任何人都可以建议一个Perl模块,它可以比较两个字符串并返回它们匹配的程度吗?我广泛搜索CPAN,虽然有像String :: Approx和Data :: Compare这样的类似模块,但它们并不是我想要的.假设我有两个字符串:我爱你,我爱你.我想要比较这两个字符串的功能,考虑到许多参数,正确顺序的单词匹配(爱作为字符串中的第一个单词不应该“匹配”爱作为第二个字符串中的第4个单词,即使两个字符串有那个单词),单词不匹配但拼写几乎相似(如说爱和loge),单词数等等,并返回一个索引,比如说1的数字从0到1,代表两者之间的相似程度这两个字符串.有没有这样的Perl模块?

解决方法

有很多这样的模块.但是,通常情况下,您必须以某种特殊方式利用它们来解释您自己的假设.像这样的大多数字符串比较工具只是实现了一些算法来比较一个字符串到另一个字符串大多数人认为,如果您要制定具体的政策决定,您将自己编码.

就个人而言,我不确定我会推荐Text::Levenshtein因为错误和缺乏ut8支持.不过,我也没有更好的建议.

但是,这些搜索将揭示许多潜在的模块,您可以查看并确定哪些最适合您的目的(基于执行此类操作的常用算法的名称):

> https://metacpan.org/search?q=levenshtein
> https://metacpan.org/search?q=wagner+fischer
> https://metacpan.org/search?q=edit+distance

如果您对口语相似性感兴趣,您还可以查看语音比较:

> https://metacpan.org/search?q=phonetic
> https://metacpan.org/search?q=soundex
> https://metacpan.org/search?q=metaphone

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读