如何在没有microsoft.office.interop的情况下将PDF转换为doc?

时间:2011-04-22 18:30:42

标签: c# pdf-generation ms-office openoffice.org doc

我需要使用C#将PDF文件转换为.doc文件。虽然计算机没有安装Office,但它没有文件系统。我有什么好主意可以解决这个问题吗?我做了一些研究,大多数人都使用互操作服务。

3 个答案:

答案 0 :(得分:0)

选项/想法可能是将PDF转换为Html,可以在Word中打开?

答案 1 :(得分:0)

您需要了解PDF并未真正实现为单一文档格式。

如果您的PDF文档是通过将文本渲染为PDF文件来创建的,那么不仅可以直接进行PDF转换,而且可以非常好(可靠)。

如果PDF的来源是扫描仪或传真(实际上是扫描仪......),那么您所拥有的是带有文本“图片”的文档。这种情况更难以处理。如果为此打开标记,则不会转换“文本”。在这种情况下,你必须处理一些OCR(光学字符识别),由于各种各样的问题,它的可靠性较低。

如果您可以选择在将数据呈现为PDF之前拦截数据(例如SSRS或Crystal中的那样),那么最好绕过PDF舞台并将数据移动到Word文档。

如果您不得不接收传真,然后需要解释其内容,请准备好OCR地狱。我去那儿已经有一段时间了,所以我希望它变得更好。

即使您的计算机上安装了办公室,您也可以访问(使用Visual Studios)Office开发人员工具包,这将允许您构建以Word格式分发的文档。(。doc / .docx)。

答案 2 :(得分:0)

使用aspose pdf工具包将pdf转换为文本,然后使用filestream或aspose doc将文本转换为doc

相关问题