DOMDocument,首先获取图像<h1> </h1>

时间:2013-11-05 14:57:15

标签: php html domdocument

我想在第一个<img>标记之后获取所有<h1>个标记,但我无法确定如何。

目前,我可以使用以下代码从网页获取所有<img>代码:

$html = file_get_contents($this->url);

$this->doc = new DOMDocument();
@$this->doc->loadHTML($html);

$tags = $this->doc->getElementsByTagName('img');

foreach ($tags as $tag) {
    array_push($this->images, $tag->getAttribute('src'));
}

如何在第一个<h1>标记 后执行此操作

1 个答案:

答案 0 :(得分:0)

对于php获取一个dom解析器。 http://simplehtmldom.sourceforge.net/manual.htm#section_traverse

找到h1标签然后使用遍历兄弟搜索img标签。

$ es = $ html-&gt; find('h1')

foreach($es->next_sibling() as $sibling) 
{
       foreach($sibling->find( 'img' ) as $img ) 
       {
             // do something...
       }
}