scape分页内容使用简单的dom解析器

时间:2014-10-08 06:45:47

标签: php dom

我想抓一个博客的标题帖,我写下面的代码。我一直想着如何遍历每一页。

$dom = file_get_html('http://demos.appthemes.com/clipper/');

    scrape('http://demos.appthemes.com/clipper/');

    function scrape($URL)
    {   
        $dom = file_get_html($URL);
        foreach ($dom->find('.item-frame h1 a') as $items) {

            $item = array('courseTitle' => $items->text());

            var_dump($item);
        }
    }

    for($pages = 0; $pages < 3;$pages++) {

            if($next = $dom->find('a[class=page]', $pages)) {
            $URL = $next->href;

            $dom->clear();
            unset($dom);

            scrape($URL);
        }
}

部分结果确实出现,但卡在错误Undefined variable: dom in on line 23

1 个答案:

答案 0 :(得分:0)

unset($dom);导致$dom变量未设置,并且在第二次循环迭代($pages == 1)调用$dom->find失败。

我没有得到逻辑,但尝试删除$dom->clear(); unset($dom);行。

希望它有所帮助。