笔者最近做数据分析与挖掘,经常遇到要合并CSV文件的问题,正好练习Python遂使用Python的Pandas库进行拼接,记下和大家分享,大家有更好的方法欢迎评论交流。

'''
Data:2017-07-13
Auther;JXNU Kerwin
Description:使用Pandas拼接多个CSV文件到一个文件(即合并)
'''
import pandas as pd
import os
Folder_Path = r'C:\foldername'          #要拼接的文件夹及其完整路径,注意不要包含中文
SaveFile_Path =  r'C:\foldername'       #拼接后要保存的文件路径
SaveFile_Name = r'all.csv'              #合并后要保存的文件名

#修改当前工作目录
os.chdir(Folder_Path)
#将该文件夹下的所有文件名存入一个列表
file_list = os.listdir()

#读取第一个CSV文件并包含表头
df = pd.read_csv(Folder_Path +'\\'+ file_list[0])   #编码默认UTF-8,若乱码自行更改

#将读取的第一个CSV文件写入合并后的文件保存
df.to_csv(SaveFile_Path+'\\'+ SaveFile_Name,encoding="utf_8_sig",index=False)

#循环遍历列表中各个CSV文件名,并追加到合并后的文件
for i in range(1,len(file_list)):
    df = pd.read_csv(Folder_Path + '\\'+ file_list[i])
    df.to_csv(SaveFile_Path+'\\'+ SaveFile_Name,encoding="utf_8_sig",index=False, header=False, mode='a+')


Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐