如何用正则表达式解析HTML?

时间:2012-06-20 10:31:36

标签: php html

  

可能重复:
  How to parse and process HTML with PHP?

我有HTML文档,其中包含许多具有以下格式的记录:

<tr><td>af</td><td>Afrikaans</td></tr>

请告诉我,如何使用正则表达式提取“af”和“南非荷兰语”?谢谢。

2 个答案:

答案 0 :(得分:1)

这只是一个简单的例子,可以帮助您入门,但根据HTML的结构,您需要进行一些调整:

$s = <<<EOM
<tr><td>af</td><td>Afrikaans</td></tr>
EOM;

$d = new DOMDocument;
$d->loadHTML($s);
foreach ($d->getElementsByTagName('td') as $node) {
    echo $node->nodeValue;
}

另请参阅DOMDocument文档

答案 1 :(得分:0)

你应该使用DOM,SAX,SimpleXML,PHPQuesry,整理而不是正则表达式来解析XML