是否可以使用Puppeteer将PDF转换为HTML?

时间:2019-06-11 00:28:45

标签: html node.js pdf puppeteer headless-browser

我知道可以用另一种方式(HTML到PDF),但是可以用另一种方式吗?

我没有找到任何与此相关的文档。

1 个答案:

答案 0 :(得分:2)

否,Puppeteer不能用于将PDF转换为HTML。根据其网站:

  

Puppeteer是一个Node库,它提供了高级API来通过DevTools协议控制Chrome或Chromium。

也就是说,木偶戏是无头的Chrome。由于Chrome无法将PDF转换为HTML(如果我记错了,请纠正我),Puppeteer也不能。

但是,您可以使用其他npm模块,例如pdf-parse来解析PDF的文本内容,并自行生成HTML。或者,只需使用pdf2html之类的npm模块直接转换pdf。