python – 在Pandas中解析多索引Excel文件
发布时间:2020-12-20 11:35:57 所属栏目:Python 来源:网络整理
导读:我有一个带有三级列MultiIndex的时间序列excel文件,如果可能的话我想成功解析.关于如何对堆栈溢出的索引执行此操作有一些结果但不是列,并且parse函数具有似乎不占用行列表的头. ExcelFile看起来像如下所示: A列是从A4开始的所有时间序列日期 B列有top_level
我有一个带有三级列MultiIndex的时间序列excel文件,如果可能的话我想成功解析.关于如何对堆栈溢出的索引执行此操作有一些结果但不是列,并且parse函数具有似乎不占用行列表的头.
ExcelFile看起来像如下所示: > A列是从A4开始的所有时间序列日期 因此,有两个low_level值,许多mid_level值和一些top_level值,但技巧是顶级和中级值为null,并假设为左侧的值.因此,例如,上面的所有列都将top_level1作为顶部多索引值. 到目前为止,我最好的想法是使用转置,但它填充未命名:#无处不在,似乎不起作用.在Pandas 0.13中,read_csv似乎有一个可以获取列表的头参数,但这似乎不适用于解析. 解决方法
您可以填充空值.我没有你的文件,但你可以测试
#Headers as rows for now df = pd.read_excel(xls_file,header=None,index_col=0) #fill in Null values in "Headers" df = df.fillna(method='ffill',axis=1) #create multiindex column names df.columns=pd.MultiIndex.from_arrays(df[:3].values,names=['top','mid','low']) #Just name of index df.index.name='Date' #remove 3 rows which are already used as column names df = df[pd.notnull(df.index)] (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |