加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

正则表达式 – 正则表达式生成器/还原器?

发布时间:2020-12-14 06:29:24 所属栏目:百科 来源:网络整理
导读:我有一个有趣的问题来自同事,我们目前有一个操作上的痛点,而且好奇的是,有什么东西(实用程序/库/算法)可能有助于自动化. 假设你有一个文字值列表(在我们的例子中,它们是URL).我们想要做的是,根据这个列表,提出一个与所有这些文字项匹配的单个正则表达式. 所
我有一个有趣的问题来自同事,我们目前有一个操作上的痛点,而且好奇的是,有什么东西(实用程序/库/算法)可能有助于自动化.

假设你有一个文字值列表(在我们的例子中,它们是URL).我们想要做的是,根据这个列表,提出一个与所有这些文字项匹配的单个正则表达式.

所以,如果我的列表是:

http://www.abc.com
http://www.abc.com/subdir
http://foo.abc.com

最简单的答案是

^(http://www.abc.com|http://www.abc.com/subdir|http://foo.abc.com)$

但是对于大量的数据来说,这是很大的,我们有一个长度限制我们试图留在下面.

目前我们手工编写正则表达式,但是这并不能很好地扩展,也不适合任何人使用.是否有更自动化的方法来分解源数据,以获得与所有源值匹配的长度最优的正则表达式?

Aho-Corasick匹配算法构建了一个有限自动机来匹配多个字符串.您可以将自动机转换为等效的正则表达式,但直接使用自动机更简单(这就是算法所做的).

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读