加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

python – 仅选择包含字母字符的行

发布时间:2020-12-20 12:32:47 所属栏目:Python 来源:网络整理
导读:我的数据采用以下格式: data = [['@datumbox','#machinelearning'],['@datumbox','#textanalysis'],['@things_internet','#iot'],'#h...'],['@custmrcom','#analytics123'],'#strategy...123'],'#1knowledgetweet'],['@tamaradull','#@bigbrother']] 我想检
我的数据采用以下格式:

data = [['@datumbox','#machinelearning'],['@datumbox','#textanalysis'],['@things_internet','#iot'],'#h...'],['@custmrcom','#analytics123'],'#strategy...123'],'#1knowledgetweet'],['@tamaradull','#@bigbrother']]

我想检查hashtag是否包含任何非字母表.如果是,则删除相应的行.

所需的输出是:

data = [['@datumbox','#iot']]

我想我需要使用re.sub(例如,re.compile(‘[^ a-zA-Z]’)).这是我到目前为止:

newdata = []

for item in data:
    regex = re.compile('[^a-zA-Z]')
    if regex.match(item[1]):
        newdata.append([item[0],item[1]])

有什么建议吗?

解决方法

使用具有条件的列表理解:

newdata = [x for x in data if x[1][1:].isalpha()]
print newdata

给出输出

[['@datumbox','#iot']]

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读