用poi提取word中的图片

最新推荐文章于 2025-06-30 10:31:15 发布

原创

最新推荐文章于 2025-06-30 10:31:15 发布 · 4.1k 阅读

标签

#import #string #文档 #office #byte

#class

收录于

这篇博客介绍了如何使用Apache POI库从Word文档中提取图片。通过创建HWPFDocument对象并遍历段落，检查CharacterRun对象是否有图片，然后使用PicturesTable类来提取和保存图片。

import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.util.List;

import org.apache.poi.hwpf.HWPFDocument;
import org.apache.poi.hwpf.extractor.*;
import org.apache.poi.hwpf.model.*;
import org.apache.poi.hwpf.usermodel.CharacterRun;
import org.apache.poi.hwpf.usermodel.Picture;
import org.apache.poi.hwpf.usermodel.Range;

public class MsWordExtractor {
   /**
* @param args
* @throws IOException
*/
public static void main(String[] args) throws IOException{

    //下面注释掉的是提取所有文字的
//    FileInputStream in = new FileInputStream("D:/poiWord/rule.doc");
//    WordExtractor extractor = new WordExtractor(in);
//
//    String [] strArray = extractor.getParagraphText();
//    String str =