我必须阅读带有文本,图像,表格,项目符号等的doc和docx文件(所有内容)
我想以相同的顺序显示文件的内容(如果图像在顶部,则文本,然后是表格)。
请让我知道如何阅读,以便我可以获得全部内容。我只能从doc和docx文件中读取文本,但无法读取整个内容。
我使用下面的代码只读取文本,请告知如何使用表格和图像阅读整个内容。
我使用下面的代码只读取文本,请告知如何使用表格和图像阅读整个内容。
我的代码如下所示:
Dim WordApp As New Word.ApplicationClass
'Dim filepath = Server.MapPath("~/files/Hello2.doc")
Dim File As Object = filename
Dim nullobj As Object = System.Reflection.Missing.Value
Dim doc As Word.Document = WordApp.Documents.Open(File, nullobj, nullobj, nullobj, nullobj, nullobj, nullobj, nullobj, nullobj, nullobj, nullobj, nullobj)
'Dim doc1 As Word.Document = WordApp.ActiveDocument
Dim m_Content As String = doc.Content.Text
答案 0 :(得分:0)
我会下载并安装OpenXML 2.5库 -
您应该能够公正地阅读文档的所有内容。这是一些文档: https://msdn.microsoft.com/en-us/library/office/cc850833.aspx
答案 1 :(得分:0)
我认为没有任何优雅的方式来实现这一目标。正如评论中提到的,不同的数据类型。
你必须得到文本(你说你已经可以这样做了),然后单独获取图像。然后格式化它们或任何你想做的事情。
从未尝试过这个,但找到了这个链接。 http://blogs.msdn.com/b/msdnmagazine/archive/2007/05/15/2649901.aspx