正则表达式 (C++) (施工中)
先来看一个例子,要求写一段代码,实现如下功能: 从标准输入中读取一行字符串, 从中读取所有邮箱的格式; 对于这个问题,用传统的方式是可以解决的: 我们可以用解析字符串的方式实现,需要遍历一遍获取的字符串,读取其中关键的几个字符 “.” "@" ".com" 和其中的相关顺序; C++11支持正则表达式,利用它可以避免重复造轮子; 代码: #include<iostream> #include<string> #include<regex> intmain() { std::stringline; std::regexemail(R"(w+@(w+.)+w+)"); while(getline(std::cin,line)) { std::smatchmatches; autocurrent=cbegin(line); autolast=cend(line); while(current!=last) { if(regex_search(current,last,matches,email)) { std::ssub_matchmatch=matches[0]; current=match.second; std::cout<<"["<<match.str()<<"]"<<std::endl; } else { break; } } } } ―――――――――――――――――――――― 正文: 一、正则表达式介绍 正则表达式(regular expression) 是一种描述字符序列的方法,是一种极其强大的计算工具。C++11中新增了这一特性,在 C++正则表达式库(RE库)中。 PS:RE库,定义在头文件 "regex"内,命名空间:std; 正则表达式组件: regex: 表示有一个正则表达式的类; regex_match: 将一个字符序列与一个正则表达式匹配; regex_search : 寻找第一个与正则表达式匹配的子序列; regex_replace: 使用给定格式替换一个正则表达式; sregex_iterator : 迭代器适配器,调用regex_search 来遍历一个string中所有匹配的子串; smatch : 容器类,保存在string中搜索的结果; ssub_match : string中匹配的子表达式的结果; 接下来简单介绍几个常用的组件: regex类: 表示一个正则表达式。除了初始化和赋值操作,还支持其他的一些操作(后面介绍); regex_match方法: 确定一个给定字符序列与一个给定regex对象是否完全匹配,返回true/false,如果匹配到,将匹配到的内容保存起来; segex_search方法: 确定一个给定字符序列与一个给定regex对象是否匹配,只要有部分匹配,就返回true,如果匹配到,将匹配到的部分保存起来; 以上两个方法均有2个重载版本,分别为: (seq,m,r,mft) (seq,mft) /* seq: 待查找的字符串序列,可以是一个std::string,或表示范围的一对迭代器,或一个指向空字符结尾的字符数组的指针 m: match对象,用来保存匹配结果的相关细节 r: regex对象,匹配的类型 mft: (可选)regex_constants::match_flag_type类型,它们会影响匹配过程(后述) */ 二、使用RE库 (待续) (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |