python – 仅选择包含字母字符的行
发布时间:2020-12-20 12:32:47 所属栏目:Python 来源:网络整理
导读:我的数据采用以下格式: data = [['@datumbox','#machinelearning'],['@datumbox','#textanalysis'],['@things_internet','#iot'],'#h...'],['@custmrcom','#analytics123'],'#strategy...123'],'#1knowledgetweet'],['@tamaradull','#@bigbrother']] 我想检
我的数据采用以下格式:
data = [['@datumbox','#machinelearning'],['@datumbox','#textanalysis'],['@things_internet','#iot'],'#h...'],['@custmrcom','#analytics123'],'#strategy...123'],'#1knowledgetweet'],['@tamaradull','#@bigbrother']] 我想检查hashtag是否包含任何非字母表.如果是,则删除相应的行. 所需的输出是: data = [['@datumbox','#iot']] 我想我需要使用re.sub(例如,re.compile(‘[^ a-zA-Z]’)).这是我到目前为止: newdata = [] for item in data: regex = re.compile('[^a-zA-Z]') if regex.match(item[1]): newdata.append([item[0],item[1]]) 有什么建议吗? 解决方法
使用具有条件的列表理解:
newdata = [x for x in data if x[1][1:].isalpha()] print newdata 给出输出 [['@datumbox','#iot']] (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |