import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.util.List;
import org.apache.poi.hwpf.HWPFDocument;
import org.apache.poi.hwpf.extractor.*;
import org.apache.poi.hwpf.model.*;
import org.apache.poi.hwpf.usermodel.CharacterRun;
import org.apache.poi.hwpf.usermodel.Picture;
import org.apache.poi.hwpf.usermodel.Range;
public class MsWordExtractor {
/**
* @param args
* @throws IOException
*/
public static void main(String[] args) throws IOException{
//下面注释掉的是提取所有文字的
// FileInputStream in = new FileInputStream("D:/poiWord/rule.doc");
// WordExtractor extractor = new WordExtractor(in);
//
// String [] strArray = extractor.getParagraphText();
// String str =

这篇博客介绍了如何使用Apache POI库从Word文档中提取图片。通过创建HWPFDocument对象并遍历段落,检查CharacterRun对象是否有图片,然后使用PicturesTable类来提取和保存图片。

408

被折叠的 条评论
为什么被折叠?



