用Java检测PDF中彩色区域内的文本

时间:2021-05-24 15:29:22

标签: java pdf image-processing pdfbox text-processing

我有这个项目,我需要检测文本是否在 pdf 发票中的红色区域(红色矩形)内。

所以我的第一种方法是将pdf转换为图像并获取它的像素数组,遍历数组,并检查像素是否为红色,如果有红色像素,然后是黑色或者其他一些颜色像素后跟红色像素,这意味着红色区域内有文本。

第二种方法,获取每个字符串的坐标,并以某种方式检查该区域周围是否有红色像素。

关于如何完成这项工作的任何想法?

PS:在第一种方法中,即使红色有变化,我也能够检查像素是否为红色,在第二种方法中,我能够获得每个字符串的坐标。

0 个答案:

没有答案
相关问题