加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

Python的pyparsing:实现语法来解析逻辑AND表达式

发布时间:2020-12-16 22:38:42 所属栏目:Python 来源:网络整理
导读:我试图解析和评估表达式,给我作为文件的输入,形式: var[3] = 0 and var[2] = 1var[0] = 1 and var[2] = 0 and var[3] = 1... (实际上我也允许“多位访问”(即var [X:Y])但是现在让我们忽略它) 其中var是整数,[]表示位访问. 例如,对于var = 0x9,上面的第一

我试图解析和评估表达式,给我作为文件的输入,形式:

var[3] = 0 and var[2] = 1
var[0] = 1 and var[2] = 0 and var[3] = 1
...

(实际上我也允许“多位访问”(即var [X:Y])但是现在让我们忽略它…)
其中var是整数,[]表示位访问.
例如,对于var = 0x9,上面的第一个表达式应该被计算为False,而第二个表达式应该被计算为True,因为0x9 = b1001.
和=是我允许的唯一二元运算符,对于=运算符,左操作数总是var [X],右操作数总是一个数字.
我试着环顾四周,发现这可以通过Python的pyparsing来实现,但是在尝试实现它时遇到了一些困难.
这是我到目前为止所尝试的,大致基于this example(这是here提供的众多示例之一):

#!/usr/bin/env python
from pyparsing import Word,alphas,nums,infixNotation,opAssoc

class BoolAnd():
    def __init__(self,pattern):
        self.args = pattern[0][0::2]

    def __bool__(self):
        return all(bool(a) for a in self.args)

    __nonzero__ = __bool__


class BoolEqual():
    def __init__(self,pattern):
        self.bit_offset = int(pattern[0][1])
        self.value = int(pattern[0][-1])

    def __bool__(self):
        return True if (0xf >> self.bit_offset) & 0x1 == self.value else False # for now,let's assume var == 0xf

    __nonzero__ = __bool__




variable_name   = 'var'
bit_access      = variable_name + '[' + Word(nums) + ']'
multibit_access = variable_name + '[' + Word(nums) + ':' + Word(nums) + ']'
value = Word(nums)

operand = bit_access | multibit_access | value

expression = infixNotation(operand,[
    ('=',2,opAssoc.LEFT,BoolEqual),('AND',BoolAnd),])


p = expression.parseString('var[3] = 1 AND var[1] = 0',True)

print 'SUCCESS' if bool(p) else 'FAIL'

我有三个需要帮助的问题.

>对于var [X:Y] = Z形式的多位访问,我该如何强制执行:
一个. X> ?
湾Z< 2 ^ {X - Y 1}
我假设这不能由语法本身强制执行(例如,对于形式var [X] = Y的单位访问,我可以通过语法强制执行Y将为0或1,这将导致如果Y!= 0/1,表达式.parseString()失败,异常.
>最重要的是:为什么它总是打印SUCCESS?我究竟做错了什么?
对于输入var [3] = 1 AND var [1] = 0,它应该是打印失败(你可以在我的例子中看到我硬编码var为0xf,所以var [3] = 1是True但是var [1] = 0为假).
>这让我想到了第三个问题:var不是BoolEqual的类成员,也不是全局的…有没有办法以某种方式将它发送到BoolEqual的__init__函数?

最佳答案
在解决问题之前,我建议对语法进行一些小的改动,主要是包含结果名称.添加这些名称将使您的结果代码更加清晰和健壮.我还使用了pyparsing_common命名空间类中最近的pyparsing版本中添加的一些表达式:

from pyparsing import pyparsing_common

variable_name   = pyparsing_common.identifier.copy()
integer = pyparsing_common.integer.copy()
bit_access      = variable_name('name') + '[' + integer('bit') + ']'
multibit_access = variable_name('name') + '[' + integer('start_bit') + ':' + integer('end_bit') + ']'

第1a部分:在“var [X:Y]”中强制执行有效值

这种工作最好使用解析操作和条件来完成.解析操作是解析时回调,您可以将其附加到您的pyparsing表达式,以修改,增强,过滤结果或在验证规则失败时引发异常.使用以下方法附加这些:

expr.addParseAction(parse_action_fn)

并且parse_action_fn可以具有以下任何签名:

def parse_action_fn(parse_string,parse_location,matched_tokens):
def parse_action_fn(parse_location,matched_tokens):
def parse_action_fn(matched_tokens):
def parse_action_fn():

(详见https://pythonhosted.org/pyparsing/pyparsing.ParserElement-class.html#addParseActio)n)

解析操作可以返回None,返回新标记,修改给定标记或引发异常.

如果所有解析操作都根据输入标记评估某些条件,则可以将其写为返回True或False的简单函数,如果返回False,则pyparsing将引发异常.在您的情况下,您的第一个验证规则可以实现为:

def validate_multibit(tokens):
    return tokens.end_bit > tokens.start_bit
multibit_access.addCondition(validate_multibit,message="start bit must be less than end bit",fatal=True)

或者甚至只是作为Python lambda函数:

multibit_access.addCondition(lambda t: t.end_bit > t.start_bit,fatal=True)

现在你可以尝试这个:

multibit_access.parseString("var[3:0]")

你会得到这个例外:

pyparsing.ParseFatalException: start bit must be less than end bit (at char 0),(line:1,col:1)

第1b部分:在“var [X:Y] = Z”中强制执行有效值

您的第二个验证规则不仅处理var位范围,还处理它与之比较的值.这将需要附加到完整BoolEqual的解析操作.我们可以把它放在BoolEqual的__init__方法中,但我更喜欢在可能的情况下分离独立的函数.由于我们将通过附加到infixNotation级别来添加我们的验证,并且infixNotation仅接受解析操作,因此我们需要将您的第二个验证规则编写为引发异常的解析操作. (我们还将使用最近才在pyparsing 2.2.0中发布的新功能,在infixNotation中的某个级别附加多个解析操作.)

以下是我们希望执行的验证:

>如果是单位表达式,则值必须为0或1
>如果多位表达式var [X:Y],则值必须<< 2 **(Y-X 1)

def validate_equality_args(tokens):
    tokens = tokens[0]
    z = tokens[-1]
    if 'bit' in tokens:
        if z not in (0,1):
            raise ParseFatalException("invalid equality value - must be 0 or 1")
    else:
        x = tokens.start_bit
        y = tokens.end_bit
        if not z < 2**(y - x + 1):
            raise ParseFatalException("invalid equality value")

我们使用以下命令将此解析操作附加到infixNotation:

expression = infixNotation(operand,(validate_equality_args,BoolEqual)),])

第3部分:支持除0xf之外的其他var名称和值

要处理各种名称的变量,可以向BoolEqual添加类级别的dict:

class BoolEqual():
    var_names = {}

并提前设定:

BoolEqual.var_names['var'] = 0xf

然后将__bool__方法实现为:

return(self.var_names [self.var_name]>> self.bit_offset)& 0x1 == self.value

(这需要扩展到支持多位,但总体思路是一样的.)

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读