将多个数字扫描到一个文档中

时间:2017-04-22 19:02:25

标签: image-processing ocr

我有很多印刷文件,右上角有12位数字。使用应用程序或设备将这些数字扫描到新行上的每个数字的最快方法是什么?非常感谢任何其他解决方案。

提前谢谢

2 个答案:

答案 0 :(得分:0)

有一个名为Kantu的软件组件正是您所需要的,PDF scraping with OCR。因此,您的代码会将PDF发送给Kantu,并将数字返回给您的代码。

You create a template (mark the area of the the invoice where the number is) and Kantu extracts this number.

您可以创建一个模板(=一个小图像,用于标记发票编号所在的发票区域),Kantu会提取此编号。

另一种选择是使用OCR软件(如Tesseract)或在线API(如OCR.space(支持PDF)或Google Cloud Vision来自行构建此类内容。

答案 1 :(得分:0)

根据文档示例,可能的解决方案是使用PythonOpenCVpallowtesseract来实现数字扫描应用程序。

  1. 使用网络摄像头录制文档并捕获帧图像。
  2. 裁剪感兴趣的区域,即仅具有12位数字的右上区域。
  3. 将裁剪后的图像传递给OCR。
  4. 将扫描的号码附加到文件中。
  5. 希望得到这个帮助。