用于检索标记的正则表达式

时间:2012-04-10 09:05:54

标签: javascript regex

在我的项目中,我想从网页中检索我使用dom方法的标签。

但可以像document.write(“<a href=”http://somedomain.com”>”);

一样动态创建标签

这里标签以字符串的格式给出,所以我试图使用正则表达式。

我想要一个匹配所有标签和属性的正则表达式,前提是表达式应该能够提取特定属性

1 个答案:

答案 0 :(得分:0)

很难理解你在问什么,这是非常不清楚的。

首先:如果你有一个选项,永远不要使用正则表达式来解析HTML。看起来很简单吧?不会。你迟早会发现问题。

第二:what David said

现在这里有一个正则表达式来匹配任何HTML标签(没有测试过它或者其他任何东西,所以如果你必须先试试它):

\<[^>]*\>

警告它也会匹配脚本标记(不要让用户在页面上写任何标记,如果必须,请将其列入白名单,并准备好在不使用库时遇到麻烦)。

例如在RegExr尝试这些(但提醒它使用ActionScript正则表达式,有时可能与Javascript不同,例如Javascript没有前瞻/后看。