我想在下面的test.html
中使用xpath查询只检索一次“Testing”<html>
<body>
<div class="test1"></div>
<div class="test2">
<div><strong>Testing</strong></div>
</div>
</body>
</html>
这是我用来检索内容的php代码。
$uri='test.html';
$doc = new DOMDocument('1.0','utf-8');
$doc->loadHTMLFile($uri);
$xpath= new DOMXPath($doc);
$path="/html/body/div[2]//*";
$elements = $xpath->query($path);
if(!is_null($elements)){
foreach($elements as $element){
echo '<br>['.$element->nodeName.']';
$nodes = $element->childNodes;
foreach($nodes as $node){
$nodeValue=$node->nodeValue;
echo $nodeValue;
}
}
}
这是我得到的结果。
[div] Testing
[strong] Testing
为什么即使在[div]节点中也会打印“测试”?我希望它只在[strong]节点中检索“测试”。
答案 0 :(得分:0)
这就是它的工作原理 - 父节点的nodeValue
将始终包含其子节点的nodeValue
。
nodeValue
并不适合您的目标。您应该在其子项中获取文本节点。请参阅此问题:Getting node's text in PHP DOM。
答案 1 :(得分:0)
您的XPath /html/body/div[2]//*
返回div[2]
的所有后代,包括子节点和孙子节点。
只让孙子使用/html/body/div[2]/*/*