PDFLib TET PHP:无法提取图像

时间:2014-02-16 09:47:40

标签: php pdf pdflib

我能够在Windows 8.1 + Xampp上安装TET(php_tet.dll),我对PDF到文本没有任何问题,但我对图像提取没有运气。

我正在使用示例“image resources.php”(和“image_extractor.php”),它应该“打印”PDF格式的一些信息(x,y,宽度,高度,alpha等)文件。还必须将所有可用(或任何)图像保存/提取到文件中(tiff,jpg)。

可以在此处找到示例:http://goo.gl/ZeDlc0

包含图像信息的部分正在运行,但没有提取文件。

我在同一文件夹中将文本提取到TXT文件没有任何问题。 所以我能写在那里吗?

我的SEARCHPATH出了什么问题?

我的尝试:

原始示例抛出ERROR:

Error 1016 in open_document(): Couldn't open PDF file 'FontReporter.pdf' for reading (file not found)

所以我改变了SEARCHPATH:

/* global option list */
$globaloptlist = "searchpath={{../data} {../../data} }";

我的pdf文件的位置:

/* global option list */
$globaloptlist = "searchpath={{D:\Workshop\www\TET\data} }";

现在我有一些输出数据通过print / echo:

page 7: 208x277pt, alpha=0, beta=0 id=0, 595x750 pixel, 1x8 bit Indexed 
page 7: 208x277pt, alpha=0, beta=0 id=1, 595x750 pixel, 1x8 bit Indexed

$ tet-> write_image_file 方法返回10,表示“我可以提取TIFF文件”

但是我的pdf文件夹或周围的任何地方都没有提取图像......

2 个答案:

答案 0 :(得分:0)

以某种方式将图像导出到D:\ workshop \ xampp \ apache

在选项FILENAME中,我需要设置ABSOLUTE路径和文件名......

$path = str_replace('\\', '/', __DIR__);

$imageoptlist = $baseimageoptlist . " filename {".$path."/out/" .
    $outfilebase . "_p" . $pageno . "_I" . $ti->imageid . "}";

    if ($tet->write_image_file($doc, $ti->imageid, $imageoptlist) == 0){
       print("Error " . $tet->get_errnum() . " in " .
          $tet->get_apiname() . "(): " . $tet->get_errmsg());
 }

答案 1 :(得分:0)

这正是我在TET手册中找到的,(第3.9章“PHP”部分):

File name handling in PHP 
Unqualified file names (without any path component) and relative file names are 
handled differently in Unix and Windows versions of PHP:
- PHP on Unix systems will find files without any path component in the directory
  where the script is located.
- PHP on Windows will find files without any path component only in the directory
  where the PHP DLL is located.

所以我想,您需要根据需要稍微调整样本。