PHP Html Dom / Parser

时间:2011-07-12 11:47:31

标签: php html dom

i)我需要使用php从html页面中提取一些元素。

ii)使用html dom解析器。

iii)我能够提取所有**<a>**s, **<b>**s, **<li>**s等等。

iv)我应该如何能够提取

中包含的类型/元素
**<td class = ""><a href = "">ABC</a></td>**

使用 href 的任何内容,即 href的属性

注意:我需要提取 ABC

2 个答案:

答案 0 :(得分:0)

这可能不是您正在寻找的答案,但我之前使用过phpquery,并发现它是一个很好的工具来完成这类工作。

http://code.google.com/p/phpquery/

答案 1 :(得分:0)

使用DOM Parser无法获得整个结构。

您应该为此目的使用getAttribute()方法。 Check here

这是一个简单的例子

$markup = file_get_contents($someplace);
$dom = new DomDocument();
$dom -> loadHTML($markup);
$tds = $dom -> getELementsByTagName("td");
foreach($tds as $td) {
    echo $td -> getAttribute("class");
}