加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

在NLTK解析器语法中混合单词和PoS标签

发布时间:2020-12-20 13:30:28 所属栏目:Python 来源:网络整理
导读:我已经玩NLTK已经有一段时间了,我正在为特殊的分块定义自定义解析器语法.我遵循 http://nltk.googlecode.com/svn/trunk/doc/book/ch07.html中的描述,但我感兴趣的内容与本章中描述的略有不同.例如,在示例7.10中,使用以下内容进行动词阶段: VP:{ VB.* NP |
我已经玩NLTK已经有一段时间了,我正在为特殊的分块定义自定义解析器语法.我遵循 http://nltk.googlecode.com/svn/trunk/doc/book/ch07.html中的描述,但我感兴趣的内容与本章中描述的略有不同.例如,在示例7.10中,使用以下内容进行动词阶段:
VP:{< VB.*>< NP | PP | CLAUSE> $}
我想只匹配使用一个特定动词而不是任何动词的句子.就像是:
VP:{go< NP | PP | CLAUSE> $}

换句话说,我想匹配单词的实际单词而不是PoS标签,并在正则表达式中混合匹配实际单词和PoS标签.

这可能吗?

解决方法

不是由nltk pos-tagger标准化的标准PoS标签.

如果你需要为不同的动词做语法,一个有用的黑客可能是预处理标签并将标记附加到所有动词的标签上.因此,您可以使用看起来像VP的正则表达式字符串:{$}

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读