正则表达式 – 使用dplyr在所选列上添加行方式均值
发布时间:2020-12-14 06:27:22 所属栏目:百科 来源:网络整理
导读:我有一个数据框,其中包含几个在不同时间点测量的变量(例如,test1_tp1,test1_tp2,test1_tp3,test2_tp1,test2_tp2,…). 我现在尝试使用dplyr向数据框添加新列,该数据框计算这些列的选择上的行方式(例如,test1的所有时间点的平均值). 即使使用用于计算显式命名
我有一个数据框,其中包含几个在不同时间点测量的变量(例如,test1_tp1,test1_tp2,test1_tp3,test2_tp1,test2_tp2,…).
我现在尝试使用dplyr向数据框添加新列,该数据框计算这些列的选择上的行方式(例如,test1的所有时间点的平均值). >即使使用用于计算显式命名列的平均值的语法,我也很困难.我没有成功的尝试是: 数据%>%…%>%mutate(test1_mean = mean(test1_tp1,na.rm = TRUE) >我还想使用正则表达式/通配符来选择列名,就像这样 data%>%…%>%mutate(test1_mean = mean(matches(“test1 _.*”),na.rm = TRUE)
您可以在select中使用starts_with来查找以某个字符串开头的所有列.
data %>% mutate(test1 = select(.,starts_with("test1_")) %>% rowMeans(na.rm = TRUE)) (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |