DomDocument获取h1标签

时间:2012-06-21 11:06:19

标签: php regex domdocument scrape

我有非常非常大的html页面/数据。我需要在h1标签下获取数据。 所以我在各种例子中看到的是DOMDOCUMENT基本上用于解析xml。 但如果我有html数据,非常网格,我想在<h1></h1>标签下获取文本,那么代码是什么。

如果有<h1>个标签

$doc = new DOMDocument();

@$doc->loadHTML($this->siteHtmlData);

$aElements = $doc->getElementsByTagName("h1")

请帮帮我。

由于

1 个答案:

答案 0 :(得分:2)

你可以循环它以获得值:

foreach ($aElementsas as $node) {
    echo $node->nodeValue, PHP_EOL;
}