image-processing - 将多个数字扫描到一个文档中

时间：2017-04-22 19:02:25

标签： image-processing ocr

我有很多印刷文件，右上角有12位数字。使用应用程序或设备将这些数字扫描到新行上的每个数字的最快方法是什么？非常感谢任何其他解决方案。

提前谢谢

答案 0 :(得分：0)

有一个名为Kantu的软件组件正是您所需要的，PDF scraping with OCR。因此，您的代码会将PDF发送给Kantu，并将数字返回给您的代码。

您可以创建一个模板（=一个小图像，用于标记发票编号所在的发票区域），Kantu会提取此编号。

另一种选择是使用OCR软件（如Tesseract）或在线API（如OCR.space（支持PDF）或Google Cloud Vision来自行构建此类内容。

答案 1 :(得分：0)

根据文档示例，可能的解决方案是使用Python与OpenCV，pallow和tesseract来实现数字扫描应用程序。

希望得到这个帮助。