PythonExcel文件操作_openpyxl与pandas结合实例【教程】

最实用的组合是openpyxl负责样式、公式、合并单元格等排版，pandas专注数据清洗与分析；读取需data_only=True获取公式结果，写入须单元格级赋值以保留格式，新增sheet用openpyxl创建并逐行写入。

用 openpyxl 读写 Excel 格式细节（如样式、公式、合并单元格），再用 pandas 做和分析，是最实用的组合方案。关键在于分工明确：pandas 负责“算”，openpyxl 负责“排版”。

openpyxl 默认不解析公式值，只读原始公式字符串；若要读计算结果，需启用 data_only=True。同时注意：它不自动跳过空行或识别表头，需手动指定范围。

用 load_workbook(filename, data_only=True) 打开文件，避免公式显示为 =SUM(A1:A10) 而不是实际数值
通过 ws.iter_rows(min_row=2, max_row=100, values_only=True) 按行提取数据，values_only=True 返回纯值（忽略样式）
把结果转成列表，再传给 pd.DataFrame()，并用第一行作列名：df = pd.DataFrame(data[1:], columns=data[0])

直接用 df.to_excel() 会清空原有样式、公式和批注。正确做法是：用 openpyxl 定位目标区域，逐单元格赋值，其他格式不动。

先用 load_workbook(filename, keep_vba=True, read_only=False) 打开（keep_vba 可选，若含宏）
定位目标工作表：ws = wb['Sheet1']，再确定起始单元格，如 start_cell = ws['C5']
遍历 DataFrame：for r_idx, row in enumerate(df.values, 1):，再嵌套列循环：for c_idx, value in enumerate(row, 1):，写入 ws.cell(row=start_cell.row + r_idx, column=start_cell.column + c_idx - 1, value=value)

适合生成报表时追加分析页，不影响原表结构和样式。

创客贴设计，一款智能在线设计工具，设计不求人，AI助你零基础完成专业设计！

213

立即学习“”；

用 wb.create_sheet(title='Analysis_2024') 新建 sheet
获取新 sheet 对象后，用 dataframe_to_rows(df, index=False, header=True) 将 DataFrame 转为可迭代行数据
逐行写入：for r_idx, row in enumerate(rows, 1):，再 for c_idx, value in enumerate(row, 1):，最后 ws.cell(r_idx, c_idx, value)
可顺手调整列宽：for col in ['A', 'B', 'C']: ws.column_dimensions[col].width = 12

openpyxl 对合并单元格敏感——读取时只有左上角单元格有值，其余为 None；写入时若覆盖已合并区域，会自动取消合并。需提前检查。

不复杂但容易忽略。核心就三点：读用 data_only，写用单元格级赋值，增删 sheet 用 openpyxl 管理结构，pandas 只管数据流。

以上就是PythonExcel文件操作_openpyxl与pandas结合实例【教程】的详细内容，更多请关注php中文网其它相关文章！

四平甲倪网络网站制作专家