tesseract命令不起作用并给出文件错误

时间:2018-08-20 11:46:50

标签: c++ ubuntu ocr tesseract lstm

我已经在ubuntu中安装了tesseract版本4.0。 我能够使用Tesseract CLI执行tesseract的所有操作,例如简单的OCR文本生成。 我想训练LSTM。 我读过此article并尝试从Build分离Tesseract后直接在终端上运行以下命令。

mkdir -p ~/tesstutorial/engoutput
training/lstmtraining --debug_interval 100 \
  --traineddata ~/tesstutorial/engtrain/eng/eng.traineddata \
  --net_spec '[1,36,0,1 Ct3,3,16 Mp3,3 Lfys48 Lfx96 Lrx96 Lfx256 O1c111]' \
  --model_output ~/tesstutorial/engoutput/base --learning_rate 20e-4 \
  --train_listfile ~/tesstutorial/engtrain/eng.training_files.txt \
  --eval_listfile ~/tesstutorial/engeval/eng.training_files.txt \
  --max_iterations 5000 &>~/tesstutorial/engoutput/basetrain.log

Althoguh创建了engouput目录。

当前路径指向tesseract的SRC目录。 出现以下错误:

  

bash:培训/ lstmtraining:没有此类文件或目录

运行为

enter image description here

1 个答案:

答案 0 :(得分:0)

已通过以下代码修复 首先创建培训数据

cd ~/tesseract-ocr/src
      training/tesstrain.sh   \
       --fonts_dir /usr/share/fonts/ \
      --lang eng   \
      --linedata_only \
      --noextract_font_properties \
      --exposures "0"    \
      --langdata_dir /home/shan/langdata_lstm \
      --output_dir /home/shan/tesstutorial/engtrain  \
      --tessdata_dir /home/shan/tesseract-ocr/tessdata \
      --fontlist "Arial"

  sudo chmod -R 777 /home/shan/tesstutorial/engtrain

然后是LSTM模型

sudo chmod -R 777 /home/shan/tesstutorial/
cd ~/tesseract-ocr/src/
training/lstmtraining --stop_training \
  --continue_from ~/tesstutorial/engoutput/base_checkpoint \
  --traineddata ~/tesstutorial/engtrain/eng/eng.traineddata \
  --model_output ~/tesstutorial/engoutput/eng.traineddata


sudo chmod -R 777 ~/tesstutorial
cd ~/tesseract-ocr/src/
training/lstmtraining --debug_interval 100   \
--traineddata ~/tesstutorial/engtrain/eng/eng.traineddata   \
--net_spec '[1,36,0,1 Ct3,3,16 Mp3,3 Lfys48 Lfx96 Lrx96 Lfx256 O1c111]'   \
--model_output ~/tesstutorial/engoutput/base --learning_rate 20e-4   \
--train_listfile ~/tesstutorial/engtrain/eng.training_files.txt   \
--max_iterations 5000 &>~/tesstutorial/engoutput/basetrain.log
相关问题