当前位置 : 主页 > 编程语言 > python >

python_合并多个表格为一个

来源:互联网 收集:自由互联 发布时间:2022-07-19
python_合并多个表格为一个,注意这里说的表格是正常的表格,有些xls结尾的表格实际上是html格式 看这 import os import pandas as pd # 将文件读取出来放一个列表里面 #file_dir = r'C:\Users\carry\


python_合并多个表格为一个,注意这里说的表格是正常的表格,有些xls结尾的表格实际上是html格式 看这

import os
import pandas as pd


# 将文件读取出来放一个列表里面
#file_dir = r'C:\Users\carry\Desktop\123' # 存放PDF的原文件夹
pwd = r'C:\Users\carry\Desktop\123' # 获取文件目录

# 新建列表,存放文件名
file_list = []

# 新建列表存放每个文件数据(依次读取多个相同结构的Excel文件并创建DataFrame)
dfs = []

# for root,dirs,files in os.walk(pwd): # 第一个为起始路径,第二个为起始路径下的文件夹,第三个是起始路径下的文件。
# for file in files:
# file_path = os.path.join(root, file)
# print(file_path)
# file_list.append(file_path) # 使用os.path.join(dirpath, name)得到全路径
# df = pd.read_excel(file_path) # 将excel转换成DataFrame
# dfs.append(df)

for root,dirs,files in os.walk(pwd): # 第一个为起始路径,第二个为起始路径下的文件夹,第三个是起始路径下的文件。
for file in files:
file_path = os.path.join(root, file)
print(file_path)
file_list.append(file_path) # 使用os.path.join(dirpath, name)得到全路径
df = pd.read_excel(file_path) # 将excel转换成DataFrame
dfs.append(df)

# 将多个DataFrame合并为一个
df = pd.concat(dfs)
df.head()

# 写入excel文件,不包含索引数据
# df.to_excel('test\\result.xls', index=False)
df.to_excel(r'C:\Users\carry\Desktop\123\result.xls', index=False)
# C:\Users\carry\Desktop\123


网友评论