正则表达式 – 提取|之间的最后一个单词|
发布时间:2020-12-14 06:24:34 所属栏目:百科 来源:网络整理
导读:我有以下数据集 head(names$SAMPLE_ID)[1] "Bacteria|Proteobacteria|Gammaproteobacteria|Pseudomonadales|Moraxellaceae|Acinetobacter|"[2] "Bacteria|Firmicutes|Bacilli|Bacillales|Bacillaceae|Bacillus|" [3] "Bacteria|Proteobacteria|Gammaproteoba
我有以下数据集
> head(names$SAMPLE_ID) [1] "Bacteria|Proteobacteria|Gammaproteobacteria|Pseudomonadales|Moraxellaceae|Acinetobacter|" [2] "Bacteria|Firmicutes|Bacilli|Bacillales|Bacillaceae|Bacillus|" [3] "Bacteria|Proteobacteria|Gammaproteobacteria|Pasteurellales|Pasteurellaceae|Haemophilus|" [4] "Bacteria|Firmicutes|Bacilli|Lactobacillales|Streptococcaceae|Streptococcus|" [5] "Bacteria|Firmicutes|Bacilli|Lactobacillales|Streptococcaceae|Streptococcus|" [6] "Bacteria|Firmicutes|Bacilli|Lactobacillales|Streptococcaceae|Streptococcus|" 我想提取||之间的最后一个字作为一个新的变量即 Acinetobacter Bacillus Haemophilus 我试过用 library(stringr) names$sample2 <- str_match(names$SAMPLE_ID,"|.*?|")
我们可以用
library(stringi) stri_extract_last_regex(v1,'w+') #[1] "Acinetobacter" 数据 v1 <- "Bacteria|Proteobacteria|Gammaproteobacteria|Pseudomonadales|Moraxellaceae|Acinetobacter|" (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |