VB.NET读取doc和docx文件

时间:2015-02-09 00:47:14

标签: c# asp.net .net vb.net

我必须阅读带有文本,图像,表格,项目符号等的doc和docx文件(所有内容)

我想以相同的顺序显示文件的内容(如果图像在顶部,则文本,然后是表格)。

请让我知道如何阅读,以便我可以获得全部内容。我只能从doc和docx文件中读取文本,但无法读取整个内容。

我使用下面的代码只读取文本,请告知如何使用表格和图像阅读整个内容。

我使用下面的代码只读取文本,请告知如何使用表格和图像阅读整个内容。

我的代码如下所示:

  Dim WordApp As New Word.ApplicationClass
            'Dim filepath = Server.MapPath("~/files/Hello2.doc")
            Dim File As Object = filename
            Dim nullobj As Object = System.Reflection.Missing.Value
            Dim doc As Word.Document = WordApp.Documents.Open(File, nullobj, nullobj, nullobj, nullobj, nullobj, nullobj, nullobj, nullobj, nullobj, nullobj, nullobj)
            'Dim doc1 As Word.Document = WordApp.ActiveDocument
            Dim m_Content As String = doc.Content.Text

2 个答案:

答案 0 :(得分:0)

我会下载并安装OpenXML 2.5库 -

您应该能够公正地阅读文档的所有内容。这是一些文档: https://msdn.microsoft.com/en-us/library/office/cc850833.aspx

答案 1 :(得分:0)

我认为没有任何优雅的方式来实现这一目标。正如评论中提到的,不同的数据类型。

你必须得到文本(你说你已经可以这样做了),然后单独获取图像。然后格式化它们或任何你想做的事情。

从未尝试过这个,但找到了这个链接。 http://blogs.msdn.com/b/msdnmagazine/archive/2007/05/15/2649901.aspx