在PHP中创建一个脚本解析器
我有一个非常冗余的配置文件格式..我发明了一种用于编写循环的自定义脚本格式,例如:
[Config Object] {Loop 3 Setting[i] = Value[i] } OtherSetting=X 这将导致: [Config Object] Setting1 = Value1 Setting2 = Value2 Setting3 = Value3 OtherSetting = X 我的第一个想法是使用正则表达式,如下所示: !{(.*?)}!is 直到我试图将它与嵌套循环一起使用时,这确实很有效 – 你肯定知道这个“哦cr …时刻” 因为以下内容: 1: [Config Object] 2: *{*Loop 3 3: Section[i] 4: {Loop 3 5: Setting[i] = Value[i] 6: *}* 7: } 8: OtherSetting=X 将引导正则表达式覆盖第2行和第6行之间的范围(用* s推销它们) 实际上我真的不知道如何解决这个问题,因为正则表达式在逻辑上是正确的. 的?需要Lazy-Operator,因为没有它我会在另一个方向遇到同样的问题,并且无法编写两个跟随循环. 一点点的研究让我清楚,正则表达式不是正确的方向, 解决方法
评论中提到了正确的解决方案.您需要实际编写编译器/解析器.从我的编译器课程来看,我的记忆有点模糊,但这就是你如何接近它.
基本概念是将输入转换为标记(这是正则表达式正常的地方).这称为词法分析 所以: [Config Object] {Loop 3 Section[i] {Loop 3 Setting[i] = Value[i] } } OtherSetting=X 成为(伪代码令牌,也许不完全是你需要的) OPEN_BRACKET STRING(=Config Object) CLOSE_BRACKET START_LOOP NUMBER(=3) STRING(=Section) OPEN_BRACKET STRING(=i) CLOSE_BRACKET START_LOOP NUMBER(=3) STRING(=Setting) OPEN_BRACKET STRING(=i) CLOSE_BRACKET EQUAL STRING(=Value) OPEN_BRACKET STRING(=i) CLOSE_BRACKET END_LOOP END_LOOP STRING(=OtherSetting) EQUAL STRING(=X) 因此,如果你的词法分析器为你提供了如上所述的一系列标记,你只需要将其解析为实际语法(因此这是你不想使用正则表达式的地方). 你的语法(对于循环)是沿着这些方向的东西(伪代码语法类似于Bison,我可能忘记了部分/故意留下的东西): INDEXED_CONFIG_LINES: INDEXED_CONFIG_LINE | INDEXED_CONFIG_LINES INDEXED_CONFIG_LINE; INDEXED_CONFIG_LINE: STRING OPEN_BRACKET STRING CLOSE_BRACKET EQUAL STRING OPEN_BRACKET STRING CLOSE_BRACKET; LOOP: START_LOOP NUMBER LOOP_BODY END_LOOP; LOOP_BODY: INDEXED_CONFIG_LINES | LOOP; 因此,您需要一个可以使用该语法来构建语法树的解析器,而不是正则表达式.你基本上只是构建一个状态机,在那里你将下一个令牌转换到某个状态(比如在循环体中等). 老实说,YAML可能会满足您的需求,而不是重新发明轮子或采用正则表达式体操.但是如果你真的需要使用你提出的循环语法,你可以看一下Symfony Yaml组件,看看它们是如何进行解析的. https://github.com/symfony/Yaml 或者你可以看看Twig有另一个有循环的解析器:https://github.com/fabpot/Twig/tree/master/lib/Twig (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |