HTML Simple Dom解析器 - 如何获取特定文本?

时间:2014-07-31 18:10:09

标签: html dom

您好我正在使用PHPSimpleDomParser从其他网页源获取日期。 您可以在此处查看有关此解析器的更多信息:http://simplehtmldom.sourceforge.net/

我可以解析dom元素,例如<div></div><img>和其他简单的HTML元素。

现在我想获取存储在Javascript中的数据文本,可以在页面源中看到。

以下是我想要的确切文字示例:

"SizeVarId":"37800208195"
"SizeVarId":"37800208215"
"SizeVarId":"37800208235"
"SizeVarId":"37800208175"

您可以理解我想要选择所有"SizeVarId":"RandomNumbers"并获取第二个引号内的数字。

它是否可行,我怎么能得到它?

谢谢!

1 个答案:

答案 0 :(得分:1)

如果您知道如何使用Regex,那将很容易。在这里,我假设此Text被分配给java脚本中的变量。

var text = '"SizeVarId":"37800208195""SizeVarId":"37800208215"';
var patt = /\"([0-9]+)\"/;
var results = patt.exec(text);
console.log(results);

这是你在PHP中的方式

$url = "http://page-you-want-to.fetch";
$ch = new curl_init($url);
curl_set_opt($ch,CURLOPT_RETURN_TRANSFER,true);
$data = curl_exec($ch);
curl_close($ch);

preg_match_all('/\"SizeVarId\":\"([0-9]+)\"/',$data,$matches);

echo '<pre>';
print_r($matches);
echo '</pre>';