读取并将.pdf文件转换为R中的.txt文件更快?

时间:2018-06-18 19:41:21

标签: r parallel-processing pdftotext

我正在尝试将.pdf文件(大部分是基于图像的)批量转换为.txt文件。以下程序成功地将基于文本和图像的pdf转换为文本文件。

我的问题是,有一组约15个pdf文件需要很长时间才能转换。它们不是特别大(最大页数在10到600之间),但我的程序大约需要45分钟来转换它们。

为什么转换它们需要这么长时间,如何加快速度?我正在使用CRAN RGui(64位)和R版本3.5.0

.pdf文件位于以下hirarchy

  1. 我的目录 - >子文件夹1-> abc.pdf
  2. 我的目录 - >子文件夹2-> def.pdf
  3. 等。

    代码如下:

    worldFront

0 个答案:

没有答案