加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

正则表达式 – 在R中查找序列中重复的字符

发布时间:2020-12-14 06:24:39 所属栏目:百科 来源:网络整理
导读:例如,我有一个字符串 "AAAAAAACGAAAAAACGAAADGCGEDCG" 我想算一下CG重复的次数. 我怎么做? 您可以使用gregexpr在vec中查找“CG”的位置.我们必须检查是否没有匹配(-1).函数sum计算匹配数. vec - "AAAAAAACGAAAAAACGAAADGCGEDCG" sum(gregexpr("CG",vec)[[1]
例如,我有一个字符串
"AAAAAAACGAAAAAACGAAADGCGEDCG"

我想算一下CG重复的次数.
我怎么做?

您可以使用gregexpr在vec中查找“CG”的位置.我们必须检查是否没有匹配(-1).函数sum计算匹配数.
> vec <- "AAAAAAACGAAAAAACGAAADGCGEDCG"
> sum(gregexpr("CG",vec)[[1]] != -1)
[1] 4

如果你有一个字符串向量,你可以使用sapply:

> vec <- c("ACACACACA","GGAGGAGGAG","AACAACAACAAC","GGCCCGCCGC","TTTTGTT","AGAGAGA")
> sapply(gregexpr("CG",vec),function(x) sum(x != -1))
[1] 0 0 0 2 0 0

如果你有一个字符串列表,你可以使用unlist(vec),然后使用上面的解决方案.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读