示例php代码将pdf文件转换为html

时间:2018-05-23 08:30:51

标签: php html pdf

我想要一个php示例代码将我的pdf转换为html输出

生病尝试所有的解决方案,但没有找到满足我的要求的解决方案。

生病只想要从pdf到html的相同输出

先谢谢

2 个答案:

答案 0 :(得分:0)

1)将.exe文件下载并解压缩到一个文件夹: http://sourceforge.net/projects/pdftohtml/

2)创建一个.php文件,并输入此代码(假设pdftohtml.exe位于该文件夹中,源sample.pdf也是如此):

<?php
$source_pdf="sample.pdf";
$output_folder="MyFolder";

    if (!file_exists($output_folder)) { mkdir($output_folder, 0777, true);}
$a= passthru("pdftohtml $source_pdf $output_folder/new_file_name",$b);
var_dump($a);
?>

3)输入 MyFolder ,您将看到转换后的文件(取决于页数..)

P.S。我不知道,但也存在许多商业或试用api。

来自here

的@ T.Todua的解决方案

答案 1 :(得分:0)

<?php
$c = curl_init();
$cfile = curl_file_create('test.pdf', 'application/pdf');
$apikey = 'YOUR_API_KEY'; // from https://pdftables.com/api
curl_setopt($c, CURLOPT_URL, "https://pdftables.com/api?key=$apikey&format=html");
curl_setopt($c, CURLOPT_POSTFIELDS, array('file' => $cfile));
curl_setopt($c, CURLOPT_RETURNTRANSFER, true);
curl_setopt($c, CURLOPT_FAILONERROR,true);
curl_setopt($c, CURLOPT_ENCODING, "gzip,deflate");
$result = curl_exec($c);
if (curl_errno($c) > 0) {
    print('Error calling PDFTables: '.curl_error($c).PHP_EOL);
} else {
  // save the HTML we got from PDFTables to a file
  file_put_contents ("test.html", $result);
}
curl_close($c);
?>

https://github.com/pdftables/php-pdftables-api