正则表达式 – 我想在R中使用gsub来匹配所有不是字母数字的项目
发布时间:2020-12-14 05:37:00 所属栏目:百科 来源:网络整理
导读:我正在使用R搜索原始的Twitter片段,但仍然遇到有非标准字母数字字符的问题,例如以下“ì?oì??”. 我想用gsub取出所有非[abcdefghijklmnopqrstuvwxyz0123456789]字符. 您是否可以使用gsub指定不在[abcdefghijklmnopqrstuvwxyz0123456789]中的那些项目的替换
我正在使用R搜索原始的Twitter片段,但仍然遇到有非标准字母数字字符的问题,例如以下“ì?oì??”.
我想用gsub取出所有非[abcdefghijklmnopqrstuvwxyz0123456789]字符. 您是否可以使用gsub指定不在[abcdefghijklmnopqrstuvwxyz0123456789]中的那些项目的替换? 解决方法
你可以用[^ …]简单地否定你的模式:
x <- "abcdeì?oì??fgh" gsub("[^A-Za-z0-9]","",x) # [1] "abcdefgh" 请注意,班级[:alnum:]匹配您给定的所有特殊字符.这就是为什么gsub(“[^ [:alnum:]]”,“”,x)不起作用的原因. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |