极乐门资源网 Design By www.ioogu.com
前言
在网上找了很多Python处理Excel的方法和代码,都不是很尽人意,所以自己综合网上各位大佬的方法,自己进行了优化,具体的代码如下。
博主也是新手一枚,代码肯定有很多需要优化的地方,欢迎各位大佬提出建议~
代码我自己已经用了一段时间,可以直接拿去用
主要功能
- 按行合并 ,即保留固定的表头(如前几行),实现多个Excel相同格式相同名字的表单按纵轴合并;
- 按列合并。 即保留固定的首列,实现多个Excel相同格式相同名字的表单按横轴合并;
- 表单集成 ,实现不同Excel中相同sheet的集成(即不汇总,仅集成到同一个新的Excel中)。此处的代码稍微改一下即可实现不同Excel中所有sheet的集成;
- 自动检测所需合并的sheet名称是否出现在所有的目标文件中,如果不是则予以提示 ;
- sheet选择、表头选择、功能选择界面实现可视化;
- 合并后进行简单的缺省值处理、格式处理
- 解决MacOS系统下文件目录中出现.DS_Store隐藏文件导致程序出错的bug。
用到的库
pandas 、tkinter 、 pathlib、os 、 xlrd
代码
import pandas as pd import tkinter as tk from tkinter import filedialog import pathlib import os import xlrd # 选择文件夹对话框,窗口交互,打开选择窗口 filedirectory = filedialog.askdirectory() p1 = pathlib.Path(filedirectory) # 该部分主要为了获取目标路径下的文件名 print(p1) bookname1 = os.listdir(p1) # 返回目标文件夹下的所有文件名 if ".DS_Store" in bookname1: bookname1.remove('.DS_Store') # 删除文件名里的.xlsx bookname = [] for n in bookname1: n1 = list(n) # 把字符变成列表 for i in range(5): # 因为去除的是.XSLX,5个字符,可以根据实际需要修改 n1.pop() # 依次删除最后一个元素 n2 = ''.join(n1) # 把列表变成字符 bookname.append(n2) excles = p1.rglob('*.xlsx') # 类似于os.work,能够返回目标路径下的文件路径,并且可以添加条件 excelarr = [] for eachexcel in excles: excelarr.append(eachexcel) # 创建目标路径下特定文件名的列表 # 建立一个交互窗口 windows = tk.Tk() windows.title('请提供如下信息') # 设置文本框的标题 windows.geometry('1000x300') # 设置界面的大小 # tk.Label(windows, text='你好!this is Tkinter', bg='green', font=('Arial', 12), width=30, height=2) # 说明:bg为背景,font为字体,width为长,height为高,这里的长和高是字符的长和高,比如height=2,就是标签有2个字符这么高) tk.Label(windows, text='请输入想要合并的sheet名称:').grid(row=0, column=0) # label用来显示不可编辑的文本和图标(提示性文字) tk.Label(windows, text='请输入想要确定的表头行数:').grid(row=1, column=0) tk.Label(windows, text='请输入您想实现的功能,1为按行合并sheet,2为按列合并sheet,3为sheet汇总:').grid(row=2, column=0) # Listbox(dict={}) # 创建可选下拉框 e1 = tk.Entry(windows) # 创建输入框 e2 = tk.Entry(windows) # 创建第2个输入框 e3 = tk.Entry(windows) e1.grid(row=0, column=1, padx=10, pady=5) e2.grid(row=1, column=1, padx=10, pady=5) e3.grid(row=2, column=1, padx=10, pady=5) tk.Button(windows, text='点击继续', width=10, command=windows.quit) .grid(row=4, column=1, sticky=tk.E, padx=10, pady=5) # sticky表示方位,NSWE为上下左右 tk.mainloop() # 结束循环 # 为变量赋值 word = str(e1.get()) number = int(e2.get()) - 1 choice = int(e3.get()) # 检查想要处理的sheet是否在所有的目标文件中 file_list = os.listdir(p1) file_list.remove('.DS_Store') # 移除Mac系统自动生成的文件 for file in file_list: # 循环遍历列出所有文件名称 file_name = os.path.join(p1, file) # 因os.listdir工具返回的是目标文件夹里文件的名字,然而打开文件需要文件路径+名字,故通过此工具获取完整的文件名 workbook = xlrd.open_workbook(file_name) # 打开遍历的文件 if word in workbook.sheet_names(): continue else: print(str(file) + '中不存在想要合并的sheet') if choice == 2: p1 = pd.ExcelFile(excelarr[0]) # 读取获取到的第一个文件名对应的文件 mergedata1 = p1.parse(header=number, sheet_name=word).iloc[:, 0] # 设置索引为第一行,如果为index_col,则索引为第一列 iloc为取特定的列 p2 = [] for i in range(0, len(excelarr)): tmp = pd.ExcelFile(excelarr[i]) # 读取文件 currentdata = tmp.parse(header=number, sheet_name=word).iloc[:, [1, 2, 3, 4]] # 读取特定的列 mergedata1 = pd.concat([mergedata1, currentdata], axis=1) # concat连接函数,唯一必须的参数是参与连接的对象的列表或字典。axis=1,表示可以按照纵轴来合并 n = currentdata.shape[1] # 返回Dataframe的行数,1为返回列数 p2.append(n) # 获取读取文件的行数列表 name_list = [] i = 0 # 获取应插入的文件名的列表 for a1 in bookname: for x in range(p2[i]): name_list.append(a1) i = i + 1 name_list.insert(0, '来自表格') mergedata1.loc[-1] = name_list # 按行插入 if choice == 1: p1 = pd.ExcelFile(excelarr[0]) # 读取获取到的第一个文件名对应的文件 mergedata1 = p1.parse(header=number, sheet_name=word) # 设置索引为第一行,如果为index_col,则索引为第一列 p2 = [] p2.append(mergedata1.shape[0]) for i in range(1, len(excelarr)): tmp = pd.ExcelFile(excelarr[i]) # 读取文件 currentdata = tmp.parse(header=number, sheet_name=word) # 读取特定的表 mergedata1 = pd.concat([mergedata1, currentdata]) # concat连接函数,唯一必须的参数是参与连接的对象的列表或字典。axis=1,表示可以按照纵轴来合并 n = currentdata.shape[0] # 返回Dataframe的行数,1为返回列数 p2.append(n) # 获取读取文件的行数列表 name_list = [] i = 0 # 获取应插入的文件名的列表 for a1 in bookname: for x in range(p2[i]): name_list.append(a1) i = i + 1 mergedata1.insert(0, '来自表格', name_list) # 插入第一列,作为表格数据来源的注释 if choice == 3: i = 0 fname = tk.filedialog.asksaveasfilename(title=u'保存文件', filetypes=[("excel", ".xlsx")]) # fideialog的一个方法,可以实现数据储存是要保存的名字 writerExcel = pd.ExcelWriter(fname+'.xlsx') # 写入到一个新的Excel,并且命名为上一步骤确认的名字 for name in bookname: p1 = pd.ExcelFile(excelarr[i]) mergedata1 = p1.parse(header=number, sheet_name=word) # 设置索引为第一行,如果为index_col,则索引为第一列 # mergedata1.dropna(thresh=4, inplace=True) # 必须使用inplace才可以使数据库记住删除的单元格 # mergedata1.dropna(axis='columns', how='all') # 删除全是缺失值的列 mergedata1.fillna('0') # 将所有缺失值填充为0 mergedata1.to_excel(writerExcel, sheet_name=name, index=False) # 新建一个sheet储存信息 i = i + 1 if choice != 3: # 数据清理 mergedata1.dropna(thresh=4, inplace=True) # 必须使用inplace才可以使数据库记住删除的单元格 mergedata1.dropna(axis='columns', how='all') # 删除全是缺失值的列 mergedata1.fillna('0') # 将所有缺失值填充为0 # 保存至excel fname = tk.filedialog.asksaveasfilename(title=u'保存文件', filetypes=[("excel", ".xlsx")]) # fideialog的一个方法,可以实现数据储存是要保存的名字 writerExcel = pd.ExcelWriter(fname + '.xlsx') # 写入到一个新的Excel,并且命名为上一步骤确认的名字 mergedata1.to_excel(writerExcel, sheet_name='汇总表', index=False) # 将之前汇总的farmdate数据通过to excel写入到Excel中 # 设置格式 sheetname = writerExcel.sheets workbook = writerExcel.book for sheets in sheetname: worksheet = writerExcel.sheets[sheets] format1 = workbook.add_format({'num_format': '###,##0.00', }) # 通过xlsxwriter模块命名format1的格式,对于数字内容,每三位进行一个分隔符,并且保留两位小数。#.00%为保留两位小数的百分数.border为边框。最后为文本换行和居中 # format2 = workbook.add_format({'bold': True, 'italic': True}) # 加粗、斜体 worksheet.set_column('A:ZZ', 16, format1) # 将上述定义的格式应用到具体的单元格 # worksheet.set_row(0, 16, format2) # 将特定格式用于表头 writerExcel.save() # 保存Excel print('success')
总结
极乐门资源网 Design By www.ioogu.com
极乐门资源网
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件!
如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
极乐门资源网 Design By www.ioogu.com
暂无利用Python pandas对Excel进行合并的方法示例的评论...
《魔兽世界》大逃杀!60人新游玩模式《强袭风暴》3月21日上线
暴雪近日发布了《魔兽世界》10.2.6 更新内容,新游玩模式《强袭风暴》即将于3月21 日在亚服上线,届时玩家将前往阿拉希高地展开一场 60 人大逃杀对战。
艾泽拉斯的冒险者已经征服了艾泽拉斯的大地及遥远的彼岸。他们在对抗世界上最致命的敌人时展现出过人的手腕,并且成功阻止终结宇宙等级的威胁。当他们在为即将于《魔兽世界》资料片《地心之战》中来袭的萨拉塔斯势力做战斗准备时,他们还需要在熟悉的阿拉希高地面对一个全新的敌人──那就是彼此。在《巨龙崛起》10.2.6 更新的《强袭风暴》中,玩家将会进入一个全新的海盗主题大逃杀式限时活动,其中包含极高的风险和史诗级的奖励。
《强袭风暴》不是普通的战场,作为一个独立于主游戏之外的活动,玩家可以用大逃杀的风格来体验《魔兽世界》,不分职业、不分装备(除了你在赛局中捡到的),光是技巧和战略的强弱之分就能决定出谁才是能坚持到最后的赢家。本次活动将会开放单人和双人模式,玩家在加入海盗主题的预赛大厅区域前,可以从强袭风暴角色画面新增好友。游玩游戏将可以累计名望轨迹,《巨龙崛起》和《魔兽世界:巫妖王之怒 经典版》的玩家都可以获得奖励。
更新日志
2024年11月17日
2024年11月17日
- 中国武警男声合唱团《辉煌之声1天路》[DTS-WAV分轨]
- 紫薇《旧曲新韵》[320K/MP3][175.29MB]
- 紫薇《旧曲新韵》[FLAC/分轨][550.18MB]
- 周深《反深代词》[先听版][320K/MP3][72.71MB]
- 李佳薇.2024-会发光的【黑籁音乐】【FLAC分轨】
- 后弦.2012-很有爱【天浩盛世】【WAV+CUE】
- 林俊吉.2012-将你惜命命【美华】【WAV+CUE】
- 晓雅《分享》DTS-WAV
- 黑鸭子2008-飞歌[首版][WAV+CUE]
- 黄乙玲1989-水泼落地难收回[日本天龙版][WAV+CUE]
- 周深《反深代词》[先听版][FLAC/分轨][310.97MB]
- 姜育恒1984《什么时候·串起又散落》台湾复刻版[WAV+CUE][1G]
- 那英《如今》引进版[WAV+CUE][1G]
- 蔡幸娟.1991-真的让我爱你吗【飞碟】【WAV+CUE】
- 群星.2024-好团圆电视剧原声带【TME】【FLAC分轨】