加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

正则表达式 – 使用dplyr在所选列上添加行方式均值

发布时间:2020-12-14 06:27:22 所属栏目:百科 来源:网络整理
导读:我有一个数据框,其中包含几个在不同时间点测量的变量(例如,test1_tp1,test1_tp2,test1_tp3,test2_tp1,test2_tp2,…). 我现在尝试使用dplyr向数据框添加新列,该数据框计算这些列的选择上的行方式(例如,test1的所有时间点的平均值). 即使使用用于计算显式命名
我有一个数据框,其中包含几个在不同时间点测量的变量(例如,test1_tp1,test1_tp2,test1_tp3,test2_tp1,test2_tp2,…).

我现在尝试使用dplyr向数据框添加新列,该数据框计算这些列的选择上的行方式(例如,test1的所有时间点的平均值).

>即使使用用于计算显式命名列的平均值的语法,我也很困难.我没有成功的尝试是:

数据%>%…%>%mutate(test1_mean = mean(test1_tp1,na.rm = TRUE)

>我还想使用正则表达式/通配符来选择列名,就像这样

data%>%…%>%mutate(test1_mean = mean(matches(“test1 _.*”),na.rm = TRUE)

您可以在select中使用starts_with来查找以某个字符串开头的所有列.
data %>%
  mutate(test1 = select(.,starts_with("test1_")) %>%
           rowMeans(na.rm = TRUE))

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读