简单的html dom返回错误的HTML

时间:2014-01-04 16:31:38

标签: html curl simple-html-dom

我正在尝试废弃网站http://www.pricegrabber.com/。我正在使用简单的html dom库。我在很多报废网站上使用了简单的html dom,它对我来说很完美,但在这个网站上它返回错误的html,当我导航到那个页面时,我无法在普通浏览器中看到它。我认为它将返回其移动版网站html。

enter image description here

虽然原始网站不同。我也通过CURL尝试了它,但它返回空结果。不知道为什么,可能是他们对他们的网站有一些限制。 想知道我是否遗漏了什么。导致它返回的html(添加图片),缺少很多我需要废弃的html元素。

任何帮助将不胜感激。 感谢

1 个答案:

答案 0 :(得分:1)

这是因为您没有指示curl处理302,301重定向事物。它可以这样做,它会返回你的html

curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);

另外,为了避免移动内容,您可以像这样使用浏览器到您的标题。

curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0');