使用javascript动态内容下载网页

时间:2015-04-28 05:17:08

标签: javascript php html

我有一个PHP脚本来下载一些网页。问题是下载的文件没有得到javascript编写的动态内容。

我想我需要一个javascript引擎或类似的东西。是否有一些php库或命令行程序用于下载包含其所有动态内容的网页?

我需要的示例:我想下载网页www.example.com/product.html

现在:我可以下载代码:

<h1></h1>

我想要的:我想下载代码:

<h1>Title written by javascript</h1>

1 个答案:

答案 0 :(得分:0)

这种情况正在发生,因为JavaScript未正确下载。您只下载HTML文件而不是附加的JavaScript文件。

一旦JavaScript可用于HTML页面,所有动态内容都将正确显示。

另一种解决方法: 您可以使用实际在浏览器中打开页面的类似Web自动化库的selenium,让浏览器执行js并准备DOM。在此之后,您可以下载HTML内容。

再一次:

您可以使用PhantomJs下载HTML页面,处理Javascript并为您提供最终输出以进行保存。

https://superuser.com/questions/448514/command-line-browser-with-js-support

相关问题