要考三级了!我用Python把有道词典单词转化成EXCEL!答题小助手
发布时间:2020-12-17 00:36:18 所属栏目:Python 来源:网络整理
导读:import xml.etree.ElementTree as ETimport pandas as pdimport numpy as nptree = ET.parse('words.xml')root = tree.getroot()words = pd.DataFrame(columns = ['word','trans','phonetic'])for item in root: df = pd.DataFrame({'word': item[0].text,'t
import xml.etree.ElementTree as ET import pandas as pd import numpy as np tree = ET.parse('words.xml') root = tree.getroot() words = pd.DataFrame(columns = ['word','trans','phonetic']) for item in root: df = pd.DataFrame({'word': item[0].text,'trans': item[1].text,'phonetic': item[2].text},index = item) print(df) words = pd.concat([words,df],ignore_index = True) words = words.drop_duplicates() words.to_excel('words1.xlsx',sheet_name = '1') 进群:548377875? ? 即可获取小编精心准备的资料全套呢! 在这里面有两个问题目前没有看懂,一个是 words = words.drop_duplicates() ,为什么要用这个,应为不用他的话每个单词会打印5遍,没办法,我就把重复项去掉了,我也不知道为什么会打印5遍。另外一个就是在sublime text 3中写 words.to_excel('words1.xlsx',sheet_name = '1') 的时候,会出现 UnicodeEncodeError: 'gbk' codec can't encode character 'u028c' in position 134: illegal multibyte sequence 可能是因为,‘gbk’搞不定音标吧,我猜的啊,不知道怎么解决,反正我在jupyter notebook中跑出来了。 是不是非常简单!赶紧用起来吧~! (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |