最实用的组合是openpyxl负责样式、公式、合并单元格等排版,pandas专注数据清洗与分析;读取需data_only=True获取公式结果,写入须单元格级赋值以保留格式,新增sheet用openpyxl创建并逐行写入。

用 openpyxl 读写 Excel 格式细节(如样式、公式、合并单元格),再用 pandas 做和分析,是最实用的组合方案。关键在于分工明确:pandas 负责“算”,openpyxl 负责“排版”。
读取带格式的 Excel 并转为 DataFrame
openpyxl 默认不解析公式值,只读原始公式字符串;若要读计算结果,需启用 data_only=True。同时注意:它不自动跳过空行或识别表头,需手动指定范围。
- 用
load_workbook(filename, data_only=True)打开文件,避免公式显示为=SUM(A1:A10)而不是实际数值 - 通过
ws.iter_rows(min_row=2, max_row=100, values_only=True)按行提取数据,values_only=True返回纯值(忽略样式) - 把结果转成列表,再传给
pd.DataFrame(),并用第一行作列名:df = pd.DataFrame(data[1:], columns=data[0])
用 pandas 处理完数据,写回原工作表(保留格式)
直接用 df.to_excel() 会清空原有样式、公式和批注。正确做法是:用 openpyxl 定位目标区域,逐单元格赋值,其他格式不动。
- 先用
load_workbook(filename, keep_vba=True, read_only=False)打开(keep_vba可选,若含宏) - 定位目标工作表:
ws = wb['Sheet1'],再确定起始单元格,如start_cell = ws['C5'] - 遍历 DataFrame:
for r_idx, row in enumerate(df.values, 1):,再嵌套列循环:for c_idx, value in enumerate(row, 1):,写入ws.cell(row=start_cell.row + r_idx, column=start_cell.column + c_idx - 1, value=value)
在已有 Excel 中插入新 sheet 并写入 pandas 表格
适合生成报表时追加分析页,不影响原表结构和样式。
创客贴设计,一款智能在线设计工具,设计不求人,AI助你零基础完成专业设计!
213 立即学习“”;
- 用
wb.create_sheet(title='Analysis_2024')新建 sheet - 获取新 sheet 对象后,用
dataframe_to_rows(df, index=False, header=True)将 DataFrame 转为可迭代行数据 - 逐行写入:
for r_idx, row in enumerate(rows, 1):,再for c_idx, value in enumerate(row, 1):,最后ws.cell(r_idx, c_idx, value) - 可顺手调整列宽:
for col in ['A', 'B', 'C']: ws.column_dimensions[col].width = 12
处理合并单元格与空单元格的兼容写法
openpyxl 对合并单元格敏感——读取时只有左上角单元格有值,其余为 None;写入时若覆盖已合并区域,会自动取消合并。需提前检查。
- 读取前检查合并区域:
for merged_cell in ws.merged_cells.ranges:,记录范围,后续逻辑跳过非首单元格 - 写入前解除合并(谨慎):
ws.unmerge_cells('A1:C1'),写完再重新合并(如有必要) - 更稳妥的做法:用
ws.cell(...).value写值后,对对应区域调用ws.merge_cells('A1:C1')
不复杂但容易忽略。核心就三点:读用 data_only,写用单元格级赋值,增删 sheet 用 openpyxl 管理结构,pandas 只管数据流。
以上就是PythonExcel文件操作_openpyxl与pandas结合实例【教程】的详细内容,更多请关注php中文网其它相关文章!
微信扫一扫打赏
支付宝扫一扫打赏
