别再手动改Word了！用Python-docx批量替换内容，还能完美保留原格式（附完整代码）-CSDN博客

Python-docx自动化办公：批量替换Word内容并保留原格式的终极指南

在快节奏的现代办公环境中，我们常常需要处理大量格式相似的Word文档——合同模板、项目报告、客户信函、标准化表单等。这些文档往往有着固定的框架结构，只需要替换其中的特定字段（如客户名称、日期、地址等）即可生成最终版本。传统的手工操作不仅效率低下，还容易出错，更让人头疼的是替换后的内容常常丢失了原有的格式设置。本文将带你深入探索Python-docx库的强大功能，实现Word文档的智能批量处理，让重复性工作变得轻松高效。

1. 为什么选择Python-docx进行文档自动化

在办公自动化领域，Python凭借其简洁的语法和丰富的库生态系统成为首选工具。而python-docx则是专门为操作Microsoft Word文档(.docx格式)而设计的库，它能够：

精确控制文档中的每一个元素（段落、表格、页眉页脚等）
保留原有格式设置（字体、颜色、大小、加粗等）
批量处理成百上千个文档
与Excel、数据库等其他数据源无缝集成

与VBA宏或Word自带的"邮件合并"功能相比，python-docx提供了更灵活的编程接口和更强大的定制能力。特别是当需要处理复杂格式或非标准文档结构时，python-docx的优势更加明显。

# 安装python-docx库
pip install python-docx

2. 文档批量替换的三种核心方法

理解Word文档的结构是掌握批量替换的关键。在python-docx中，一个文档由多个段落(Paragraph)组成，每个段落又包含多个运行块(Run)——即具有相同格式的连续文本。这种层级结构决定了我们有不同层次的替换策略。

2.1 方法一：段落级替换（简单但会丢失格式）

from docx import Document

def simple_replace(template_path, output_path, replacements):
    doc = Document(template_path)
    for para in doc.paragraphs:
        for old_text, new_text in replacements.items():
            if old_text in para.text:
                para.text = para.text.replace(old_text, new_text)
    doc.save(output_path)

# 使用示例
replacements = {'#name': '张三', '#date': '2023-07-15'}
simple_replace('template.docx', 'output.docx', replacements)

适用场景：当替换后的文本可以接受统一段落格式时，这种方法最为简单直接。但需要注意的是，所有替换内容将继承段落的默认格式，原有的特殊格式（如加粗、颜色等）会丢失。

2.2 方法二：运行块级替换（保留原格式）

def run_level_replace(template_path, output_path, replacements):
    doc = Document(template_path)
    for para in doc.paragraphs