要考三级了！我用Python把有道词典单词转化成EXCEL！答题小助手

发布时间：2020-12-17 00:36:18 所属栏目：Python 来源：网络整理

导读：import xml.etree.ElementTree as ETimport pandas as pdimport numpy as nptree = ET.parse('words.xml')root = tree.getroot()words = pd.DataFrame(columns = ['word','trans','phonetic'])for item in root: df = pd.DataFrame({'word': item[0].text,'t

import xml.etree.ElementTree as ET
import pandas as pd
import numpy as np
tree = ET.parse('words.xml')
root = tree.getroot()
words = pd.DataFrame(columns = ['word','trans','phonetic'])
for item in root:
 df = pd.DataFrame({'word': item[0].text,'trans': item[1].text,'phonetic': item[2].text},index = item)
 print(df)
 words = pd.concat([words,df],ignore_index = True)
 words = words.drop_duplicates()
words.to_excel('words1.xlsx',sheet_name = '1')

进群：548377875? ? 即可获取小编精心准备的资料全套呢！

在这里面有两个问题目前没有看懂，一个是

words = words.drop_duplicates()

，为什么要用这个，应为不用他的话每个单词会打印5遍，没办法，我就把重复项去掉了，我也不知道为什么会打印5遍。另外一个就是在sublime text 3中写

words.to_excel('words1.xlsx',sheet_name = '1')

的时候，会出现

UnicodeEncodeError: 'gbk' codec can't encode character 'u028c' in position 134: illegal multibyte sequence

可能是因为，‘gbk’搞不定音标吧，我猜的啊，不知道怎么解决，反正我在jupyter notebook中跑出来了。

是不是非常简单！赶紧用起来吧~！

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!