python:pandas合并csv文件的方法(图书数据集成)
发布时间:2020-12-16 20:54:44 所属栏目:Python 来源:网络整理
导读:数据集成:将不同表的数据通过主键进行连接起来,方便对数据进行整体的分析。 两张表:ReaderInformation.csv,ReaderRentRecode.csv ReaderInformation.csv: ReaderRentRecode.csv: pandas读取csv文件,并进行csv文件合并处理: # -*- coding:utf-8 -*-im
数据集成:将不同表的数据通过主键进行连接起来,方便对数据进行整体的分析。 两张表:ReaderInformation.csv,ReaderRentRecode.csv ReaderInformation.csv: ReaderRentRecode.csv: pandas读取csv文件,并进行csv文件合并处理: # -*- coding:utf-8 -*- import csv as csv import numpy as np # ------------- # csv读取表格数据 # ------------- ''' csv_file_object = csv.reader(codecs.open('ReaderRentRecode.csv','rb')) header = csv_file_object.next() print header print type(header) print header[1] data = [] for row in csv_file_object: data.append(row) data = np.array(data) print data[0::,0] ''' # ------------- # pandas读取表格数据 # ------------- import pandas as pd df = pd.read_csv('ReaderRentRecode.csv') # 读者借阅信息表 ''' print df.head() print '----------------' print df[['读者证号','读者姓名','书名','中图法分类号']] # 选取其中的四列 print '------------------------------------------------------------------' print ''' dd = pd.read_csv('ReaderInformation.csv') ''' print dd.head() print '----------------' print dd[['读者证号','读者性别','读者单位','读者类别']] print '------------------------------------------------------------------' print ''' data = pd.merge(df,dd,on=['读者证号','读者姓名'],how='left') # pandas csv表左连接 data = data[['读者证号','中图法分类号','读者类别']] print data print '------------------------------------------------------------------' print # ------------- # pandas写入表格数据 # ------------- data.to_csv(r'data.csv',encoding='gbk') 合并后的csv文件:data.csv 通过使用pandas的函数merge来进行两个表的左连接,最后得到相应的data.csv文件。 以上这篇python:pandas合并csv文件的方法(图书数据集成)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持编程小技巧。 您可能感兴趣的文章:
(编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |