加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

Python正则表达式非贪婪表现得像贪婪

发布时间:2020-12-20 11:04:21 所属栏目:Python 来源:网络整理
导读:我正在处理成绩单,并且在以非贪婪的方式匹配模式方面遇到困难.它仍然抓得太多,看起来像在做贪婪的比赛. 成绩单如下: John doe:您好,我是John Doe. 你好,我是Jane Doe. 感谢您的光临,我们将在两分钟后开始. 山姆史密斯:[没有音频]大家早上好. 要在中找到发
我正在处理成绩单,并且在以非贪婪的方式匹配模式方面遇到困难.它仍然抓得太多,看起来像在做贪婪的比赛.

成绩单如下:

>> John doe:您好,我是John Doe.

>>你好,我是Jane Doe.

>>感谢您的光临,我们将在两分钟后开始.

>>山姆史密斯:[没有音频]大家早上好.

要在>>中找到发言人的姓名(无论名称):我写道

pattern=re.compile(r'>>(.*?):')
transcript='>> John doe: Hello,I am John Doe. >> Hello,I am Jane Doe. >> Thank you for coming,we will start in two minutes. >> Sam Smith: [no audio] Good morning,everyone.'
re.findall(pattern,transcript)

我期待’John Doe’和’Sam Smith’,但它给了我’John Doe’和’你好,我是Jane Doe. >>感谢您的光临,我们将在两分钟后开始. >>山姆史密斯’

我很困惑因为.*?是非贪婪的,我认为应该能够抓住’Sam Smith’.我该如何修复代码,以便它只能抓取任何内容
>> (无论名称):?另外,我使用的是Python 3.6.

谢谢!

解决方法

你真的需要正则表达式吗?您可以拆分>>提示然后过滤掉你的名字.

>>> [i.split(':')[0].strip() for i in transcript.split('>>') if ':' in i]
['John doe','Sam Smith']

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读