加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

.net – 在正则表达式中使用嵌套的命名组,是否可以导航层次结构

发布时间:2020-12-13 21:53:46 所属栏目:百科 来源:网络整理
导读:我开发了一个匹配 pstops页面规范的正则表达式. (正则表达式空白不重要.) ^(?:(?modulod+):)?(?pages (?pagespec (?pageno-?d+) (?rotation[RUL]?)? (?:@(?scaled*(?:.d+)))? (?:( (?xoffd*.?d+)(?xunitin|cm|w|h)?,(?yoffd*.?d+)(?yunitin|cm|w
我开发了一个匹配 pstops页面规范的正则表达式. (正则表达式空白不重要.)
^(?:(?<modulo>d+):)?
(?<pages>
  (?<pagespec>
    (?<pageno>-?d+)
    (?<rotation>[RUL]?)?
    (?:@(?<scale>d*(?:.d+)))?
    (?:(
      (?<xoff>d*.?d+)(?<xunit>in|cm|w|h)?,(?<yoff>d*.?d+)(?<yunit>in|cm|w|h)?
    ))?
  +?)+,?
)+$

.

'Sample string:
'"4:1L@.7(21cm,0)+-2L@.7(21cm,14.85cm),1L(21cm,14.85cm)"

如您所见,有嵌套的命名子组.例如,pagespec不需要指定旋转.我希望能够做到这一点:

If match.Groups("pages").Captures(0).Groups("pagespecs").Captures(1).Groups("rotation").Value > ""

但当然Captures没有Groups属性.有没有办法以这种方式访问??层次结构中的子组?

编辑:这是一个更简单的例子(这次重要的空白区域):

(?<paragraph>(?:(?<sentence>The (?<child>boy|girl) is hungry.|The (?<parent>mother|father) is angry.)s*)+)

与此字符串匹配:

The boy is hungry. The mother is angry. The girl is hungry.

产生一场比赛.在那场比赛中,

>组(“段落”)有一个匹配整个字符串的捕获.
>组(“句子”)有三个捕获.
>团体(“孩子”)有两个捕获,男孩和女孩.
>团体(“父母”)有一个捕获,母亲.

但没有什么可以告诉我父母的单一捕获位于第二次捕获的句子内,除非我开始查看每次捕获的索引和长度.

编辑:这是最终的答案:

^(?:(?<modulo>d+):)?
(?<pages>
  (?<pagespec>
    (?<pageno>-?d+)
    (?<rotation>[RUL]?)
    (?:@(?<scale>d*(?:.d+)))?
    (?:(
      (?<xoff>d*.?d+)(?<xunit>in|cm|w|h)?,(?<yoff>d*.?d+)(?<yunit>in|cm|w|h)?
    ))?
    (?<pageno>)(?<rotation>)(?<scale>)(?<xoff>)(?<xunit>)(?<yoff>)(?<yunit>)
  +?)+,?
 (?<pagespec>)
)+

这会将NULL推送到每个页面之间的pagespec堆栈上,因此它们可以与页面相关联;每个pagespec之间的每个其他命名堆栈上都有一个NULL.哎呀,解析很难……

我不认为这是可能的.据我所知,不同的群体在如何嵌套在模式中彼此没有关系.而且,这样的层次结构甚至没有意义,因为组名可以在.NET中重用:
(?<group>
  (?<sub>.)
)+
(?<sub>.)

我想在某种程度上也可以将这个分层树表示出来,但是这会破坏堆栈的目的,.NET会为捕获而维护.也许我应该澄清一点:.NET并不是简单地列出一个组的所有捕获 – 它将它们推到一个堆栈上,例如,可以用它来重新弹出它们(?< -sub>).现在,如果一个组的实例稍后从堆栈中弹出一些先前匹配的东西,你将如何对待它?我认为如果不是不可能解决一般情况,那将会变得非常不直观.

您真正想要的是根据页面对应的单个“实例”对页面规格进行分组.您可以通过阻止解决方案的原因执行此操作,您希望:您可以重用组:

^(?:(?<modulo>d+):)?
(?<pages>
  (?<pagespecs>
     # here goes your actual pagespec pattern
  [+]?)+
  (?<pagespecs>),?
)+$

现在,在每个页面的末尾,您将一个空字符串推送到pagespecs堆栈.由于pagespecs的正常“实例”将始终包含至少一个字符,因此您知道任何空捕获都必须来自pagespecs的单独使用.因此,您现在可以通过空字符串元素分割Captures(“pagespecs”),然后将它们按顺序与Captures(“pages”)中的元素相关联.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读