正则表达式 – 在R中查找序列中重复的字符
发布时间:2020-12-14 06:24:39 所属栏目:百科 来源:网络整理
导读:例如,我有一个字符串 "AAAAAAACGAAAAAACGAAADGCGEDCG" 我想算一下CG重复的次数. 我怎么做? 您可以使用gregexpr在vec中查找“CG”的位置.我们必须检查是否没有匹配(-1).函数sum计算匹配数. vec - "AAAAAAACGAAAAAACGAAADGCGEDCG" sum(gregexpr("CG",vec)[[1]
例如,我有一个字符串
"AAAAAAACGAAAAAACGAAADGCGEDCG" 我想算一下CG重复的次数.
您可以使用gregexpr在vec中查找“CG”的位置.我们必须检查是否没有匹配(-1).函数sum计算匹配数.
> vec <- "AAAAAAACGAAAAAACGAAADGCGEDCG" > sum(gregexpr("CG",vec)[[1]] != -1) [1] 4 如果你有一个字符串向量,你可以使用sapply: > vec <- c("ACACACACA","GGAGGAGGAG","AACAACAACAAC","GGCCCGCCGC","TTTTGTT","AGAGAGA") > sapply(gregexpr("CG",vec),function(x) sum(x != -1)) [1] 0 0 0 2 0 0 如果你有一个字符串列表,你可以使用unlist(vec),然后使用上面的解决方案. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |