artificial-intelligence - 如何检测PDF中的可视块？

时间：2019-02-23 17:09:52

标签： artificial-intelligence ocr

我正在尝试OCR简历。我的第一个问题是在OCR之前获取文档的主要块。

由于所有简历都有“可视块”（指专业经验，技能，语言，爱好等等），所以我想知道是否有任何开源解决方案可以将文件“拆分”为“块”无论布局设计如何（我都认为这是AI的工作方式）

谢谢

答案 0 :(得分：0)

pdf格式类似于后记。

还尝试将pdf转换为后记，以查看内容的排列方式。

解压缩pdf。

一旦您看到了数据的显示方式=>您就可以开始使用徽标来提取更多含义。