解析下载链接的网站?

时间:2012-03-06 15:55:05

标签: php html parsing xml-parsing

我为客户编写了一个小工具,可以从开发人员提供的永久链接中为我们的客户下载该软件的最新稳定版本。但是,它们的beta版和开发版都有永久链接,因此需要我每次都手动更新代码。

是否有任何简单的方法可以解析此网站http://dl.bukkit.org/downloads/craftbukkit/以获取指向每种类型的最新下载网址的链接? (推出/β/发育)?

2 个答案:

答案 0 :(得分:1)

看看这个PHP Lib:http://simplehtmldom.sourceforge.net/ 它完全符合您的要求。

答案 1 :(得分:1)

require_once('simple_html_dom.php');

$html = file_get_html('http://dl.bukkit.org/downloads/craftbukkit/');

$dom = new DOMDocument;
libxml_use_internal_errors(true);
echo $dom->loadHTML($html) ? "success<br/>" : "failed<br/>";
libxml_clear_errors();
$dom->preserveWhiteSpace = true;


foreach ($dom->getElementsByTagName('div') as $element){
    if($element->getAttribute('class') == "innerContent"){
        foreach ($element->getElementsByTagName('a') as $link) {
            if( $link->getAttribute('class') == "tooltipd")
            {
                echo $link->getAttribute('href')."<br/>";
            }
        }
    }
}