C#正则表达式可选命名组

时间:2017-05-12 01:04:41

标签: c# regex

我有这种模式:

 string ISLTokenPattern = @"\d+:(\s+)?(?<local>\d+)[-][>](\s+)?(?<remote>\d+)\s+(?<wwn>..:..:..:..:..:..:..:..)\s+\d+\s(?<name>.+)\s+[s][p]:\s+\w+.\w+\s+\w+[:]\s+\d+.\w+\s+((?<trunk>TRUNK))?\s";

我有这个输入:

  1:  0-> 20 10:00:50:eb:1a:11:e3:4e 105 cwymdsae05      sp: 16.000G bw: 64.000G TRUNK QOS CR_RECOV FEC 
  2: 21->  5 10:00:50:eb:1a:12:a1:d3 108 cwymdsae08      sp: 16.000G bw: 96.000G TRUNK QOS CR_RECOV FEC 
  3: 32->  0 55:0e:b1:ae:a0:20:0e:46 160 fcr_fd_160      sp:  8.000G bw:  8.000G 
  4: 33->  1 55:0e:b1:ae:a0:20:0e:46 160 fcr_fd_160      sp:  8.000G bw:  8.000G 
  5: 66-> 46 10:00:50:eb:1a:11:e3:4e 105 cwymdsae05      sp: 16.000G bw: 64.000G 

在RegExStorm.Net上,模式匹配所有5行输入。通常,如果某些东西在那里工作,它在C#中工作。在我的代码中,匹配在第3,4和5行失败。如果我取消

((?<trunk>TRUNK))?\s

在第3,4和5行的末尾匹配,但第1行和第2行失败。我需要它来匹配两者。作为一种解决方法,我有2个模式并测试2个匹配,但我宁愿做一个模式和1个测试。

以下是执行匹配的代码:

  string ISLTokenPattern = @"\d+:(\s+)?(?<local>\d+)[-][>](\s+)?(?<remote>\d+)\s+(?<wwn>..:..:..:..:..:..:..:..)\s+\d+\s(?<name>.+)\s+[s][p]:\s+\w+.\w+\s+\w+[:]\s+\d+.\w+\s+((?<trunk>TRUNK))?\s";


 if (RegexExtensions.TryMatch(out tokenMatch, line, ISLTokenPattern)
        {
            string local = tokenMatch.Groups["local"].Value;
            string remote = tokenMatch.Groups["remote"].Value;
            string wwn = tokenMatch.Groups["wwn"].Value.ToUpper();

            string name = "";
          if (tokenMatch.Groups["name"].Success)
           {
              name = tokenMatch.Groups["name"].Value;
            }

这是我写的RegExtension类。这个程序解析文本文件,我做了很多匹配,所以想要一些可以匹配的东西,并在一步中测试成功,以保持代码清洁。

 public static class RegexExtensions
{
    public static bool TryMatch(out Match match, string input, string pattern)
    {
        match = Regex.Match(input, pattern);
        return (match.Success);
    }

    public static bool TryMatch(out MatchCollection match, string input, string pattern)
    {
        match = Regex.Matches(input, pattern);
        return (match.Count > 0);
    }
}

1 个答案:

答案 0 :(得分:1)

我注意到当前正则表达式的一个可能问题是结尾:

\s+((?<trunk>TRUNK))?\s

这在正则表达式的末尾匹配一个或多个空格,后跟TRUNK的可选命名捕获组,后跟单个空间。请注意,的日志行TRUNK(可能后跟其他文本)只有一个空格。但是这种模式预计有两个或更多的空间。您使用的解决方案,即删除最终\s可能有效。但您也可以移动可选捕获组内的空间,即

\s+((?<trunk>TRUNK\s))?

这可选择匹配TRUNK后跟一个空格。您使用的具体取决于您的实际数据。