将包含文本的图像转换为可编辑文本

时间:2011-02-24 04:42:39

标签: image

我有一个从硬拷贝中扫描的pdf文件。因此,pdf文件具有硬拷贝的图像。现在,当我尝试将pdf转换为单词时,我没有得到一个可编辑的文档,而是我得到一个图像坐在word文档上。有什么方法可以制作出可编辑的文档吗?任何软件程序或哪些东西可以帮助我做到这一点?

1 个答案:

答案 0 :(得分:3)

它被称为光学字符识别OCR

有很多软件包可以做到这一点 - 在程序中尝试http://code.google.com/p/tesseract-ocr/