Question

我试图非贪婪地解析TD标签。我从这样的事情开始：

<TD>stuff<TD align="right">More stuff<TD align="right>Other stuff<TD>things<TD>more things

我正在使用以下作为我的正则表达式：

Regex.Split(tempS, @"\<TD[.\s]*?\>");

记录返回如下：

""
"stuff<TD align="right">More stuff<TD align="right>Other stuff"
"things"
"more things"

为什么不拆分第一个完整的结果（以“stuff”开头的那个）？如何使用或不使用参数调整正则表达式以拆分TD标签的所有实例？

Answer 1

对于非贪婪的匹配，请尝试此<TD.*?>

Answer 2

你想要的正则表达式是<TD[^>]*>：

<     # Match opening tag
TD    # Followed by TD
[^>]* # Followed by anything not a > (zero or more)
>     # Closing tag

注意：.匹配任何内容（包括空格），因此[.\s]*?是多余的而且错误，因为[.]与文字.匹配，因此请使用.*?。

Answer 3