tesseract - 通过从图像中查找文本坐标来提取文本区域

我正在开发一种图像处理软件，从手机摄像头拍摄的图像中提取/裁剪和增强这种裁剪的单页表格。表格没有矩形边界，以简化提取过程。是黑色的白色背景文本格式，但除此之外没有任何东西是固定的。现在将出现一些文本，将验证图像是否是所需的形式。所以我的问题是这些。

1）我可以使用leptonica库本身搜索特定的正则表达式，或者我是否必须将焦点转移到tessarect API之类的其他库来执行此操作。到目前为止，我还没有发现任何此类

2）现在假设我知道左上角和右下角的文字，我成功地搜索了它。我可以得到我正在搜索的特定文本的坐标，然后相应地裁剪图像吗？ / p>