加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

ruby-on-rails – 如何在Nokogiri的HTML代码中找到电子邮件地址

发布时间:2020-12-17 01:26:35 所属栏目:百科 来源:网络整理
导读:如何在Nokogiri的 HTML代码中找到电子邮件地址? 我想我需要使用正则表达式,但不知道如何. 示例代码 html titleExample/title body This is an example text. example@example.com /body /html 当有一个关于mail_to的href时,有一个答案覆盖案例,但这不是我的
如何在Nokogiri的 HTML代码中找到电子邮件地址?
我想我需要使用正则表达式,但不知道如何.

示例代码

<html>
    <title>Example</title>
    <body>
    This is an example text.
    example@example.com
    </body>
    </html>

当有一个关于mail_to的href时,有一个答案覆盖案例,但这不是我的情况.电子邮件地址有时位于链接中,但并非总是如此.

谢谢

解决方法

如果你只是试图从一个恰好是HTML的字符串中解析电子邮件地址,那么就不需要Nokogiri.

html_string   = "Your HTML here..."
email_address = html_string.match(/[A-Z0-9._%+-]+@[A-Z0-9.-]+.[A-Z]{2,4}/i)[0]

这不是一个完美的解决方案,因为构成“有效”电子邮件地址的RFC非常宽松.这意味着您遇到的大多数正则表达式(包括上面的表达式)都不考虑边缘情况有效地址.例如,根据RFC

$A12345@example.com

是一个有效的电子邮件地址,但不会与上面的正则表达式匹配.

>推荐阅读:http://haacked.com/archive/2007/08/21/i-knew-how-to-validate-an-email-address-until-i.aspx
>正则表达式来源:http://www.dzone.com/snippets/ruby-method-extract-emails

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读