有个朋友让我帮他看下PDF替换文字的代码,他给的代码是在网上找的基于itext,找到需要替换文字在文档中的坐标,然后在对应位置画上替换后的文字(基本网上一搜索就出来了)。不过这种方法有几个致命的问题,例如:
1. 查找文字坐标位置大小是个问题
2. 替换后的文字大小字体是个问题
3. 好像据说只能替换一页(我没跑起来那个代码/(ㄒoㄒ)/~~)
4.。。。
后来网上找了一下,找到一个第三方的类库aspose.pdf,然后自己写了一个demo,分享给需要的朋友,也为自己留着备用。不过这个类库是收费了,不然会有水印(天朝不止有墙,还有梯子↓)。
看下替换效果:
demo代码如下:
package pub.hlc;
import com.aspose.pdf.*;
import java.io.InputStream;
public class Main {
private static String srcPath = "E:\\test.pdf"; //源文件路径
private static String targetPath = "E:\\test2.pdf"; //输入文件路径
private static String srcText = "Entity"; //需要替换的文本
private static String targetText = "Hello"; //替换的目标文本
public static void main(String[] args) {
InputStream license = Main.class.getClassLoader().getResourceAsStream("\\license.xml");
try {
new License().setLicense(license);
} catch (Exception e) {
e.printStackTrace();
}
Document pdfDoc = new Document(srcPath);
TextFragmentAbsorber textFragmentAbsorber = new TextFragmentAbsorber(srcText);
PageCollection pages = pdfDoc.getPages();
System.out.println("文档总页码数:"+pages.size());
pages.accept(textFragmentAbsorber);
int i = 0;
for (TextFragment textFragment :(Iterable<TextFragment>) textFragmentAbsorber.getTextFragments()) {
textFragment.setText(targetText);
textFragment.getTextState().setBackgroundColor(com.aspose.pdf.Color.getRed()); //添加红色背景
System.out.println(++i);
}
pdfDoc.save(targetPath);
System.out.println("总共替换"+i+"处");
System.out.println("OK");
}
}
不要诧异license.xml,加上那个就没有水印了O(∩_∩)O哈哈~
本文探讨了PDF文档中文字替换的常见问题,包括定位文字坐标、字体匹配及页面限制等。作者分享了一段基于Aspose-PDF的代码示例,展示了一个更优的解决方案,尽管该类库存在收费和水印问题。

2054

被折叠的 条评论
为什么被折叠?



