从卷曲中获取其他网站的信息有没有更好的方法?

时间:2011-07-22 20:47:19

标签: php mysql optimization curl

一个网站将信息存储在ID中,例如http://website.com/index.php?id=1。它有大约500,000条记录。

我需要检索它们并将它放在数据库(MySQL)中。现在我使用curl并获取该信息,但速度非常慢。我在一小时内只得到了大约4,000条记录。

我的问题是,有没有办法更快地完成这项工作?

3 个答案:

答案 0 :(得分:1)

如果你不反对使用perl,CPAN模块Web :: Scraper是有效抓取页面的传统方法。请参阅http://metacpan.org/pod/Web::Scraper

答案 1 :(得分:0)

使用JSONP
再多JSON With Padding

答案 2 :(得分:0)

您总是可以将wget与php中的exec函数结合使用。当然,这假设您已将服务器配置为允许php执行shell命令。但是,wget明显快于curl