Html - 提取信息

时间:2014-12-03 12:50:53

标签: php html parsing dom

我需要从html代码中提取一些信息, 我有这两种结构:

<p>Street 1a</p>
<p>12345 Berlin</p>

<p>
Street 1a
<br>
12345 Berlin
</p>

我的问题是如何使用一种方法从两个结构中提取字符串'Street 1a'。

我考虑过为每一个可能的html-sturcure编写一个方法,但这要做很多工作。 我还考虑过解析整个html代码并进行模式匹配,但也不是很优雅, 像:

$xml = new DOMDocument();
libxml_use_internal_errors(true);

// Load the url's contents into the DOM
$xml->loadHTMLFile($url);
libxml_clear_errors();

// pattern matching now

有人对此有一些经验吗?

问候和感谢!

1 个答案:

答案 0 :(得分:-1)

<div id="extract">
    <p>Street 1a</p>
    <p>12345 Berlin</p>
</div>

你的脚本应该是这样的

$(document).ready(function() {
    $('#extract p').each(function() {
    console.log($(this).text());
}); 
});