python – 仅选择包含字母字符的行

发布时间：2020-12-20 12:32:47 所属栏目：Python 来源：网络整理

导读：我的数据采用以下格式： data = [['@datumbox','#machinelearning'],['@datumbox','#textanalysis'],['@things_internet','#iot'],'#h...'],['@custmrcom','#analytics123'],'#strategy...123'],'#1knowledgetweet'],['@tamaradull','#@bigbrother']] 我想检

我的数据采用以下格式：

data = [['@datumbox','#machinelearning'],['@datumbox','#textanalysis'],['@things_internet','#iot'],'#h...'],['@custmrcom','#analytics123'],'#strategy...123'],'#1knowledgetweet'],['@tamaradull','#@bigbrother']]

我想检查hashtag是否包含任何非字母表.如果是,则删除相应的行.

所需的输出是：

data = [['@datumbox','#iot']]

我想我需要使用re.sub(例如,re.compile(‘[^ a-zA-Z]’)).这是我到目前为止：

newdata = []

for item in data:
    regex = re.compile('[^a-zA-Z]')
    if regex.match(item[1]):
        newdata.append([item[0],item[1]])

有什么建议吗？

解决方法

使用具有条件的列表理解：

newdata = [x for x in data if x[1][1:].isalpha()]
print newdata

给出输出

[['@datumbox','#iot']]

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!