使用Regex检索Html属性

时间:2009-08-10 12:31:34

标签: c# .net regex

我需要一种快速的方法将一堆html属性放入Dictionary中。像这样

<body topmargin=10 leftmargin=0 class="something"> should amount to

attr["topmargin"]="10"
attr["leftmargin"]="0"
attr["class"]="something"

这是在服务器端完成的,标签内容已经可用。我只需要清除没有价值的标签,并考虑不同的引号或缺少。

我猜应该使用正则表达式。发现了一些类似的问题,但没有一个真正符合我的需要。

由于

编辑:澄清服务器端

2 个答案:

答案 0 :(得分:4)

HtmlAgilityPack怎么办?

答案 1 :(得分:0)

我也认为使用专门的解析器会更好,但是如果你想使用正则表达式,请尝试类似:

\<(?<tag>[a-zA-Z]+)( (?<name>\w+)="?(?<value>\w+)"?)*\>

我刚试过它,效果很好