第1步:
对项目添加引用
Microsoft Word 11.0 Object Library
第2步:
在程序中添加
using Word = Microsoft.Office.Interop.Word;
第3步:
程序中添加
Word.Application app = new Microsoft.Office.Interop.Word.Application(); //可以打开word程序
Word.Document doc = null; //一会要记录word打开的文档
word文档和word程序可不是一回事奥!
第4步:
一般来说,对于抽取word内容,用的方法很少
public override void openFile(object fileName){} //打开文档
public override object readPar(int i){} //读取word文档的第i段
public override int getParCount(){} //返回word文档一共几段
public override void closeFile(){} //关闭文档
public override void quit(){} //关闭word程序
//从网页上拷贝的目录有时候会出现手动换行符^l,,先将其换成回车段落标记,才能正确读取
public void replaceChar(){}
5:代码
public override void openFile(object fileName)
{
try
{
if (app.Documents.Count > 0)
{
if (M

本文介绍了使用C#通过Microsoft.Office.Interop.Word库读取Word文件的步骤,包括添加引用、操作Word应用程序,以及读取文档内容的方法,如打开文档、读取段落、获取段落数量和关闭文档。还提到了如何处理网页拷贝的目录换行符问题,并指出通过调整代码可以读取句子或整个文档内容。最后,作者提到为了支持多种格式的抽取,采用抽象类的设计方式。

1876

被折叠的 条评论
为什么被折叠?



