如何在tesseract OCR中安装语言

时间:2018-10-19 11:34:13

标签: ocr tesseract

我已经安装了tesseract OCR,它在语言列表中只有'eng'和'osd'。我需要德语。我厌倦了命令

brew install tesseract-ocr-deu

但是我出错了。

Error: No available formula with the name "tesseract-ocr-deu" 
==> Searching for a previously deleted formula (in the last month)...
Warning: homebrew/core is shallow clone. To get complete history run:
   git -C "$(brew --repo homebrew/core)" fetch --unshallow

Error: No previously deleted formula found.
==> Searching for similarly named formulae...
Error: No similarly named formulae found.
==> Searching taps...
==> Searching taps on GitHub...
Error: No formulae found in taps.

4 个答案:

答案 0 :(得分:8)

在Mac OS上,输入

brew install tesseract-lang 

安装所有语言,您可以通过以下语言进行检查,

tesseract --list-langs

答案 1 :(得分:3)

在MacOS Mojave(10.14.3)上可以运行:

   brew install tesseract-lang

答案 2 :(得分:2)

您从tesseract存储库下载了它们。

目前,适用于4.0的tessdata here和适用于3.04的tessdata here

答案 3 :(得分:0)

为了完整起见,我添加了一个关于如何在Linux上的Tesseract OCR中安装和使用非英语语言的答案。由于这是我在Google上获得的第一个结果,因此我认为这可能会对某人有所帮助。

要在Ubuntu / Debian上安装德语:

$ sudo apt-get install tesseract-ocr-deu

可以在这里找到所有受支持语言的语言代码:

https://github.com/tesseract-ocr/tessdoc/blob/master/Data-Files-in-different-versions.md

要在OCR引擎中指定语言,请使用:-l lang,例如对于德语:

$ tesseract -l deu 'imagename' 'stdout'