DOM php按标签名称删除所有标签

时间:2013-05-08 16:12:18

标签: php html dom

我遇到了一段时间以来一直使用的脚本问题,直到我遇到这个问题才对我有用。

我有一个脚本,我想从html源代码中删除所有p html标签。 该脚本的确可以正常工作,因为它只删除了一些p标记,但却留下了一些标记。

我不明白为什么会这样做。

$doc = new DOMDocument();

$a = <<<FAIL
<html><body>
<div style="clear:both"></div>
<p class="articletitle">hoo</p>
<p class="articletext">hmmm</p>
<p class="articletext">hmmmm</p>
<p align="center"></p>
</body></html>
FAIL;

$doc->loadHTML($a);
$list = $doc->getElementsByTagName("p");

foreach ($list as $l) {
$l->parentNode->removeChild($l);
$c++;
}
echo $doc->saveHTML() . $c;

脚本返回

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd">
<html><body>
<div style="clear:both"></div>

<p class="articletext">hmmm</p>

<p align="center"></p>

省去两个p标签......

你能帮我找一下为什么它会跳过一些标签

1 个答案:

答案 0 :(得分:10)

尝试这种方式:

$doc->loadHTML($a);
$list = $doc->getElementsByTagName("p");

while ($list->length > 0) {
    $p = $list->item(0);
    $p->parentNode->removeChild($p);
}