删除标记Regex之间的所有内容

时间:2017-07-06 15:37:52

标签: javascript regex

我试图删除任何html标记内的所有内容:

输入:

<a class="yoyo"> <h1 id="test"> hello </h1> </a>

奇怪的例子,但很好

输出:

<a><h1>hello</h1></a>

我试过/(<\w)(?:.*)(>)/gmi,但它不起作用......

如果你有任何线索。 感谢

所以在你发表评论之后解释一下我取消了一个网站,我有一个.txt文件,我想要清理。它将包含页面的整个html,我想清理每个html标签并删除空格。 所以任何&lt; *和&gt;之间的所有内容都是如此。应该删除。

2 个答案:

答案 0 :(得分:0)

以下正则表达式如何:

Select Id, Name, Start_end from #Values
cross apply (
        Select top ([end] - [start] +1) Start_end = [start] + Row_number() over (order by (Select NULL))-1
        from master..spt_values s1, master..spt_values s2
        ) a

你必须连接所有的比赛。

答案 1 :(得分:0)

使用DOM方法执行此操作。遍历所有元素,迭代属性并删除它们

&#13;
&#13;
let cont = document.getElementById('demo-container'),
  els = cont.querySelectorAll('*');

[].slice.call(els).forEach(el => {
  [].slice.call(el.attributes).forEach(attr => {
    el.removeAttribute(attr.name);
  })
});

console.log(cont.innerHTML)
&#13;
<div id="demo-container">
  <a class="yoyo">
    <h1 id="test"> hello </h1>
  </a>
</div>
&#13;
&#13;
&#13;