加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

正则表达式 – 拆分camelCase列名

发布时间:2020-12-13 22:54:02 所属栏目:百科 来源:网络整理
导读:我一直在努力解决这个问题,并且我想在这里问一下. 假设我有一个如下数据框: df - data.frame(participant = 1:6,group = c("adult","adult","child","NSS","NSS"),RegProto = c(2,3,4,2,3),RegInt = c(2,6,5),RegDistant = c(3,5,IrregProto = c(4,1),Irreg
我一直在努力解决这个问题,并且我想在这里问一下.

假设我有一个如下数据框:

df <- data.frame(participant = 1:6,group = c("adult","adult","child","NSS","NSS"),RegProto = c(2,3,4,2,3),RegInt = c(2,6,5),RegDistant = c(3,5,IrregProto = c(4,1),IrregInt = c(4,4),IrregDistant = c(4,8,9,1))

这个数据框的问题是每个变量包含两个变量:一个变量,其值为Reg或Irreg,另一个变量的值为Proto,Int或Distant.我想做的是拆分这些列并使表长,最好使用tidyr.我以为我可以这样做.

library("tidyr")
df_long <- df %>%
gather(index,n,-group,-participant) %>%
select(participant,group,index,n) %>%
separate(index,into = c("verb","similarity"),sep = ".?=p{Upper}")

这是我想要的,直到separate().我收到一条错误消息,指出这些值没有拆分,但没有其他建议可能会出现这种情况.我是regex的新手,所以我怀疑问题必须存在,但我无法弄清楚正确的语法是什么.

你可以使用这个正则表达式:
(?<=.)(?=[A-Z])

这表示(零长度)位置后跟一个大写字母,后面跟任何字符.

命令:

library(dplyr)
df %>%
  gather(index,-participant) %>%
  select(participant,n) %>%
  separate(index,sep = "(?<=.)(?=[A-Z])")

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读