tesseract - 使用Tesseract 4从图像中检测单词的准确性差

我目前正在一个项目中，需要从图像中提取日期，时间，经度和纬度（如图所示）。通过使用tesseract 4，我可以获取日期和时间，但有一点错误，即数字“ 0”被识别为“ 6”（关于此，我是否需要使用自己的数据微调tesseract 4？）。但是，对于位于图像底部的经度和纬度，识别结果非常差，它甚至不会返回数字（仅返回符号和一些随机字母）。我一直在寻找方法，以便在传递给tesseract之前，通过对opencv应用二进制，otsu阈值和高斯模糊来提高准确性。但是，结果似乎是最糟糕的，因为字母的底部趋于与白色背景合并（可能是由于经度和纬度字母的白色）。

我有什么办法可以得到准确的结果？我是这个领域的新手，希望有人可以为此提供一些解决方案或建议。

预先感谢一百万。 Image

使用Tesseract 4从图像中检测单词的准确性差

0 个答案: