nodejs批量修改word文档目录样式

工作中遇到一个需求:写个nodejs脚本,对word文档(1000+个)的目录页面进行美化。实现过程遇到不少麻烦,在此分享下。

整体思路

        众所周知,Docx格式的Word文档其实是个以xml文件为主的zip压缩包,所以,页面美化整体思路是:先将文档后缀名改为zip并解压到本地,然后将关键的XML文档解析为DOM树,再通过DOM操作对文档进行编辑,最后把修改好的内容替换到原文件中,打包好并恢复后缀名。

        其中,难点在于“文档编辑”,网上基本搜不到有用的资料,只能自行摸索,主要用到的依赖包为 cheerio,作用是用DOM的方式加载和操作XML文档,函数方法类似jQuery。(解压打包等常规操作,下文忽略)

一、定位目录内容

        将Word文档解压后,内部一般会包含上百个文件,其中,文档的文本内容均位于“word/document.xml”中;

// 加载XML文档DOM树
let $ = cheerio.load(fs.readFileSync(path.join(解压后的文件夹,'word/document.xml')), {
    normalizeWhitespace: false,
    xmlMode: true,
    decodeEntities: false
});

       &

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

半吊子伯爵

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值