加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

正则表达式 – 我想在R中使用gsub来匹配所有不是字母数字的项目

发布时间:2020-12-14 05:37:00 所属栏目:百科 来源:网络整理
导读:我正在使用R搜索原始的Twitter片段,但仍然遇到有非标准字母数字字符的问题,例如以下“ì?oì??”. 我想用gsub取出所有非[abcdefghijklmnopqrstuvwxyz0123456789]字符. 您是否可以使用gsub指定不在[abcdefghijklmnopqrstuvwxyz0123456789]中的那些项目的替换
我正在使用R搜索原始的Twitter片段,但仍然遇到有非标准字母数字字符的问题,例如以下“ì?oì??”.

我想用gsub取出所有非[abcdefghijklmnopqrstuvwxyz0123456789]字符.

您是否可以使用gsub指定不在[abcdefghijklmnopqrstuvwxyz0123456789]中的那些项目的替换?

解决方法

你可以用[^ …]简单地否定你的模式:

x <- "abcdeì?oì??fgh"
gsub("[^A-Za-z0-9]","",x)
# [1] "abcdefgh"

请注意,班级[:alnum:]匹配您给定的所有特殊字符.这就是为什么gsub(“[^ [:alnum:]]”,“”,x)不起作用的原因.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读