将PDF转换为可以通过Word打开的任何内容

时间:2010-09-10 20:09:35

标签: c# pdf converter

想通过C#,所有内联,没有Process.Start()......和免费...可以是RTF,HTML,无论情况如何......只要我可以在Word中打开,然后我可以将其保存为RTF,然后我可以在RichTextBox中加载。

我知道这些年来类似的问题充斥着这个论坛,但似乎没有什么能解决我的问题。

编辑:

看起来可以在这里完成:http://www.itextpdf.com/examples/iia.php?id=275

2 个答案:

答案 0 :(得分:2)

使用PDF库(例如iTextSharp)来解析PDF。您将能够访问PDF中的所有文本和图像,并转换为您想要的任何表示。

还有其他解决方案(例如安装xpdf并对其进行shelling - 如果传入正确的命令行参数,它将转换为html。)

答案 1 :(得分:0)

我不确定Word是否可以打开pdf,除非您在word文档中创建了pdf。

我认为唯一的快速解决方案是购买或找到进行PDF处理的第三方库,然后使用它的API来提取您需要的文本。在任何情况下,任何情况下的文本格式都非常糟糕我相信。还要注意,一些显示文本的pdf实际上已将其保存为图像,因此无法获取数据。