获取html标签内/之间的所有内容

时间:2010-02-27 13:08:50

标签: php regex xpath

获取一些html元素+值的最佳方法是什么?例如:

<div id="abc" class="classs">
    <img src="pic1.png" alt="pico">
    <img src="pic2.png" alt="nano">
</div>

我所拥有的是div元素的 id = abc 。 我想把所有内容都放在div元素中:

class of the div ("classs")
src of the pictures and other data:
src="pic1.png", alt="pico"
src="pic2.png", alt="nano"

它应该在数组,对象或其他东西中。 你更喜欢什么? XPath的?正则表达式? XMLObject组成?

2 个答案:

答案 0 :(得分:1)

您可能想要使用PHP Simple HTML DOM Parser

答案 1 :(得分:0)

使用此功能:

public function innerHTML($DOMnode) {
    return preg_replace(
        '/^<(\w+)\b.*?>(.*)<\/\1?>/s',
        '$2',
        $DOMnode->ownerDocument->saveXML($DOMnode)
    );
}