正则表达式 “双向最小匹配”
最近做一个 字符串查找的例子从字符串中提取制定内容 如下:
String input = " <a href=" <a href="authentication.html?file=KF619L_Z.pdf" class="icondrawing balloonbtn" rel="shadowbox;width=720">外観図面</a>"; 需要提取 "authentication.html?file=KF619L_Z.pdf" 代码 如下: using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Text.RegularExpressions; using System.Threading.Tasks; namespace regDemo { class Program { static void Main(string[] args) { String input = " <a href=" <a href="authentication.html?file=KF619L_Z.pdf" class="icondrawing balloonbtn" rel="shadowbox;width=720">外観図面</a>"; Console.WriteLine(getCenterString(input,"href="","" class=")); Console.ReadKey(); } public static String getCenterString(String input,String left,String right) { Match match = Regex.Match(input,left + "(.+?)" + right); while (match.Success) { return match.Groups[1].Value; } return ""; } } } 中间加了 ? 目的是 非贪婪匹配。 但是效果并不理想,效果如下:
按照最小匹配原则,原则上我们应该得到理想结果,但是却没有。 这是因为在正则的解释器中,对于最小匹配原则的理解为正向最小匹配, 而不是双向最小匹配。 左侧匹配后 定住左侧边界 直到找到右侧为止
我们换个思路: 中间包含在我们左侧的字符即可,
我们对代码进行改进:
Match match = Regex.Match(input,left + "(((?!" + left + ").)+?)" + right);
得到了我们想要的结果:
补充:
【零宽断言】 正则表达四一些字符可以匹配一句话的开始、结束(^ $)或者匹配一个单词的开始、结束(b)。这些元字符只匹配一个位置,指定这个位置满足一定的条件,而不是匹配某些字符,因此,它们被成为零宽断言。所谓零宽,指的是它们不与任何字符相匹配,而匹配一个位置;所谓断言,指的是一个判断。正则表达式中只有当断言为真时才会继续进行匹配。 在有些时候,我们精确的匹配一个位置,而不仅仅是句子或者单词,这就需要我们自己写出断言来进行匹配。下面是断言的语法:
更多参考:http://www.cnblogs.com/youring2/archive/2009/11/07/1597786.html (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
- 8、multiple reactors(能适应更大的突发I/O) 多个事件循环
- ruby-on-rails – Sidekiq列出所有工作[排队运行]
- c – cocos2d CCLayer.m UIAccelerometer已被弃用警告
- ruby-on-rails – 通过link_to,rails将show参数从show acti
- ruby-on-rails – 设计模型用户和个人资料Omniauth Faceboo
- Swift(iOS 8 SDK)将Unmanaged转换为ABMultiValueRef
- .net – xml字符串的一般反序列化
- ruby-on-rails – 如何编写spree控制器装饰器的测试?
- 解决 System.IO.FileNotFoundException: 未能加载文件或程序
- c# – 对任务完成做出反应:`.ContinueWith()`vs`GetAwaite