如何从HTML文档中获取IMG标记代码?

时间:2010-10-01 11:56:46

标签: php html-parsing

我如何从文本中获取img代码? 现在,如果代码如下所示,我会收到代码和网址:text text <img src = "image.gif" />,但如果代码为<img src = "image.gif" target = _blank />,那么我会收到以下网址:"image.gif" target = _blank

那么,如何正确找到img完整代码和网址?

由于

preg_match_all('/\<img src = (.*?)\/>/', $input, $all_img);

1 个答案:

答案 0 :(得分:5)

不要尝试使用正则表达式解析HTML;使用像PHP’s DOM libraryPHP Simple HTML DOM Parser这样的HTML解析器(请参阅Gordon对其他替代方案的评论)。

这是PHP Simple HTML DOM Parser的一个例子:

$html = str_get_html('…');
foreach ($html->find('img[src]') as $img) {
    echo $img->getAttribute('src');
}
相关问题