使用VB.net将PDF转换为文本文件

时间:2009-09-29 08:20:05

标签: vb.net pdf ocr

我有一个扫描的PDF文件,我需要一个VB.net源代码,将扫描的PDF转换为文本格式。

2 个答案:

答案 0 :(得分:2)

扫描文件很可能没有文本而是图像,因此您必须查看OCR工具才能获取文本。

有几个OCR库,如

Open source OCR

https://stackoverflow.com/questions/1085/free-ocr-library

答案 1 :(得分:0)

看看http://snipt.org/lOgh/ - 它在C#中(应该相对容易在VB.NET中重写),并使用可通过API访问的托管OCR解决方案