我已经安装了tesseract OCR,它在语言列表中只有'eng'和'osd'。我需要德语。我厌倦了命令
brew install tesseract-ocr-deu
但是我出错了。
Error: No available formula with the name "tesseract-ocr-deu"
==> Searching for a previously deleted formula (in the last month)...
Warning: homebrew/core is shallow clone. To get complete history run:
git -C "$(brew --repo homebrew/core)" fetch --unshallow
Error: No previously deleted formula found.
==> Searching for similarly named formulae...
Error: No similarly named formulae found.
==> Searching taps...
==> Searching taps on GitHub...
Error: No formulae found in taps.
答案 0 :(得分:8)
在Mac OS上,输入
brew install tesseract-lang
安装所有语言,您可以通过以下语言进行检查,
tesseract --list-langs
答案 1 :(得分:3)
在MacOS Mojave(10.14.3)上可以运行:
brew install tesseract-lang
答案 2 :(得分:2)
答案 3 :(得分:0)
为了完整起见,我添加了一个关于如何在Linux上的Tesseract OCR中安装和使用非英语语言的答案。由于这是我在Google上获得的第一个结果,因此我认为这可能会对某人有所帮助。
要在Ubuntu / Debian上安装德语:
$ sudo apt-get install tesseract-ocr-deu
可以在这里找到所有受支持语言的语言代码:
https://github.com/tesseract-ocr/tessdoc/blob/master/Data-Files-in-different-versions.md
要在OCR引擎中指定语言,请使用:-l lang
,例如对于德语:
$ tesseract -l deu 'imagename' 'stdout'