在HTML页面中查找所有文本节点

时间:2012-05-24 02:22:05

标签: javascript html

  

可能重复:
  getElementsByTagName() equivalent for textNodes

对于this question,我需要查找特定节点下的所有文本节点。我可以这样做:

function textNodesUnder(root){
  var textNodes = [];
  addTextNodes(root);
  [].forEach.call(root.querySelectorAll('*'),addTextNodes);
  return textNodes;

  function addTextNodes(el){
    textNodes = textNodes.concat(
      [].filter.call(el.childNodes,function(k){
        return k.nodeType==Node.TEXT_NODE;
      })
    );
  }
}

然而,鉴于使用XPath可以简单地查询.//text()并完成它,这似乎是不优雅的。

在HTML文档中的特定元素下获取所有文本节点的最简单方法是什么,适用于IE9 +,Safari5 +,Chrome19 +,Firefox12 +,Opera11 +?

“最简单”被宽松地定义为“高效而短暂,没有高尔夫”。

2 个答案:

答案 0 :(得分:118)

根据@ kennebec的回答,对同一逻辑的实施略微严格:

function textNodesUnder(node){
  var all = [];
  for (node=node.firstChild;node;node=node.nextSibling){
    if (node.nodeType==3) all.push(node);
    else all = all.concat(textNodesUnder(node));
  }
  return all;
}

然而,使用createTreeWalker更快,更紧凑,更优雅,以便浏览器为您删除除文本节点之外的所有内容:

function textNodesUnder(el){
  var n, a=[], walk=document.createTreeWalker(el,NodeFilter.SHOW_TEXT,null,false);
  while(n=walk.nextNode()) a.push(n);
  return a;
}

答案 1 :(得分:5)

function deepText(node){
    var A= [];
    if(node){
        node= node.firstChild;
        while(node!= null){
            if(node.nodeType== 3) A[A.length]=node;
            else A= A.concat(deepText(node));
            node= node.nextSibling;
        }
    }
    return A;
}