如何阅读PDF文件的内容?

时间:2012-07-18 04:03:49

标签: algorithm nlp artificial-intelligence

我正在撰写论文,应用程序将使用自然语言问题解答。我已经阅读了几个想法并且关于自然语言问题回答的讨论,但我似乎找不到好的答案。

问题:如何从PDF,纯文本或MS Word文件中获得答案?

如果我想在PDF文件中搜索主题,我会使用 Ctrl + F 来查找主题/想法,但它不会返回所有细节;就像一个目录,它将给出一章的起始页和结束页。这就是我想要的逻辑。它将确定章节的结束位置而不使用页面或数字。有没有算法可以做到这一点?

1 个答案:

答案 0 :(得分:0)

我使用iTextPDF阅读PDF文件内容。

相关问题