作者:帅得不敢出门 C++爱好者灌水天堂群 3503799 转载请保留此信息
提取xpdf中的PDFTOTEXT到vc工程中
首先从Download Xpdf and XpdfReader
下载xpdf-3.02.tar.gz
新建一个vc工程mymypdftotext
方法一:
拷贝xpdf-3.02/xpdf与xpdf-3.02下的源文件(.h .cc .h.in .c)到工程目录下
拷贝fofii、goo、 splash文件夹到工程目录下 导入源文件到工程中
为工程引入头文件查找路径
E:/vccode/mypdftotext;E:/vccode/mypdftotext/fofi;E:/vccode/mypdftotext/goo;E:/vccode/mypdftotext/splash
编译出现cannot open file aconf.h错误提示,新建一个aconf.h文件内容为#include “aconf.h.in”到工程中。
如果出现pow重载解析查不到的错误
修改Gstring.cc中代码
x = floor(x * pow((10, prec) + 0.5);
为
x = floor(x * pow((long)10, (double)prec) + 0.5);
编译,把出现error的源文件与其同名的.h文件从工程中删除(有2,3个是unix相关的,其他的则非pdftotxt的文件如PDFTOPS.cc,PDFINFO.cc)
直到编译成功。
方法二:
根据pdftotext的makefile,拷贝其依赖的源程序到工程中,编译。
Xpdf是一款开源的PDF文件查看和处理工具,具有广泛的功能和跨平台支持。它最初由Glyph & Co.开发,并在1995年首次发布,其后由GemBox团队维护。
功能特点:
- PDF查看功能:Xpdf是一个轻量级且高效的PDF查看器,支持多种操作系统,包括Windows、Mac OS X、Linux以及基于UNIX的系统(如VMS和OS/2)。
- 命令行工具:除了图形界面外,Xpdf还提供了一套丰富的命令行工具,用于处理PDF文件。这些工具包括:
pdftoppm:将PDF页面转换为PPM、PGM或PBM图像文件。pdftopng:将PDF页面转换为PNG图像文件。pdftohtml:将PDF转换为HTML。pdfinfo:提取PDF元数据。pdffonts:列出PDF文件中使用的字体。pdfdetach:从PDF文件中分离嵌入的附件。
- 高级配置选项:用户可以通过配置文件(如
.xpdfrc)自定义字体路径、颜色设置、页面缩放比例等参数,以满足个性化需求。 - 跨平台支持:Xpdf基于Qt GUI工具包开发,因此能够在多个平台上运行,包括Windows、macOS和Linux。
- 开源许可:Xpdf遵循GNU通用公共许可证(GPL),允许用户自由使用、修改和分发。
技术实现与依赖:
- Xpdf使用C++编写,核心依赖于FreeType、libpng和zlib等第三方库。
- 它支持远程服务器模式,允许用户通过服务器名称管理多个PDF文件。
- 在某些版本中,Xpdf还集成了对加密PDF的支持。
历史与发展:
- 自1995年首次发布以来,Xpdf经历了多次更新和改进。例如,最新版本为4.05,于2019年发布。
- 它不仅是一个独立的PDF查看器,还提供了许多实用的命令行工具,使其成为处理PDF文件的强大工具集。
应用场景:
- Xpdf广泛应用于文档查看、文本提取、图像提取、元数据获取等领域。例如,它可以用于将PDF文档转换为文本文件或HTML格式,或者从PDF中提取图像和字体列表。
- 此外,Xpdf也被集成到一些专业软件中,如用于计算机取证的工具。
Xpdf是一款功能全面且灵活的PDF处理工具,适合需要高效、跨平台PDF解决方案的用户。无论是作为独立的PDF查看器还是作为命令行工具集的一部分,它都能满足用户的多样化需求。
2383

被折叠的 条评论
为什么被折叠?



