正则表达式选择不在<a> tag</a>中的单词

时间:2013-11-13 06:44:45

标签: c# regex

使用正则表达式,如何匹配<a>标记中的特定单词。

例如。我正在寻找不是链接的单词software(即未被<a ... </a>包围)

示例输入

... <a href='#'>this software</a> ... software ... <a href='#'>software</a>.

是否可以使用正则表达式仅匹配第二个software

如果不可能,如果匹配的元素位于<a>标记内,您如何检查C#?

2 个答案:

答案 0 :(得分:4)

可能:是

推荐:否

有很多可能有帮助的HTML解析器

以下是关于为什么不推荐它的好文章:RegEx match open tags except XHTML self-contained tags。即使我尝试

,我也无法把它变得更好

答案 1 :(得分:0)

我对这个要求并不完全清楚。以下正则表达式应该为您可能正在寻找的东西提供一些基础......

(?<=\</\w*\>).*
相关问题