python_合并多个表格为一个,注意这里说的表格是正常的表格,有些xls结尾的表格实际上是html格式 看这 import os import pandas as pd # 将文件读取出来放一个列表里面 #file_dir = r'C:\Users\carry\
python_合并多个表格为一个,注意这里说的表格是正常的表格,有些xls结尾的表格实际上是html格式 看这
import osimport pandas as pd
# 将文件读取出来放一个列表里面
#file_dir = r'C:\Users\carry\Desktop\123' # 存放PDF的原文件夹
pwd = r'C:\Users\carry\Desktop\123' # 获取文件目录
# 新建列表,存放文件名
file_list = []
# 新建列表存放每个文件数据(依次读取多个相同结构的Excel文件并创建DataFrame)
dfs = []
# for root,dirs,files in os.walk(pwd): # 第一个为起始路径,第二个为起始路径下的文件夹,第三个是起始路径下的文件。
# for file in files:
# file_path = os.path.join(root, file)
# print(file_path)
# file_list.append(file_path) # 使用os.path.join(dirpath, name)得到全路径
# df = pd.read_excel(file_path) # 将excel转换成DataFrame
# dfs.append(df)
for root,dirs,files in os.walk(pwd): # 第一个为起始路径,第二个为起始路径下的文件夹,第三个是起始路径下的文件。
for file in files:
file_path = os.path.join(root, file)
print(file_path)
file_list.append(file_path) # 使用os.path.join(dirpath, name)得到全路径
df = pd.read_excel(file_path) # 将excel转换成DataFrame
dfs.append(df)
# 将多个DataFrame合并为一个
df = pd.concat(dfs)
df.head()
# 写入excel文件,不包含索引数据
# df.to_excel('test\\result.xls', index=False)
df.to_excel(r'C:\Users\carry\Desktop\123\result.xls', index=False)
# C:\Users\carry\Desktop\123