在2个字符串之间提取文本?

时间:2014-06-30 17:02:41

标签: php html web-scraping scrape

我有一个巨大的HTML页面,其中包含多个这样的数据

<td style="font-size:24px;" bgcolor="#F0F0F0" width="60%">
    <strong>ID:Full Name:email@email.com:Mobile:Country</strong>
</td>

我想在ID:Full Name:email@email.com:Mobile:Country

标签之间提取数据

那么正则表达式或任何自定义PHP函数是什么?

PS:上面的代码在页面中重复多次,我希望所有数据都存储在一个数组中。

1 个答案:

答案 0 :(得分:0)

正如其他人所说,你可以使用DOMDocumentDOMXpath。像这样:

$html = '<td style="font-size:24px;" bgcolor="#F0F0F0" width="60%"> <strong>ID:Full Name:email@email.com:Mobile:Country</strong></td>';
$dom = new DOMDocument();
$dom->loadHTML($html);
$xpath = new DOMXpath($dom);
$text = $xpath->query('//td/strong')->item(0)->nodeValue;
echo $text; // ID:Full Name:email@email.com:Mobile:Country