正则表达式库bug

时间:2013-01-17 18:10:32

标签: c

我使用T-Rex正则表达式库来验证输入的字符串到以下正则表达式

(“(([A-PR-UWYZ][A-HK-Y]{0,1}[0-9]{1,2}[ABCEHMNPRTVWXY]{0,1}|GIR)\s{0,2}([0-9][ABD-HJLN-UW-Z]{2}))”)

但应该传递的"A11AA"之类的字符串失败。你能帮帮我吗?

您可以在http://sourceforge.net/projects/tiny-rex/中找到T-Rex源代码。

2 个答案:

答案 0 :(得分:0)

猜测,突然之间:

#include "trex.h"
#include <stdio.h>
#include <string.h>

#ifdef _UNICODE
#define trex_sprintf swprintf
#else
#define trex_sprintf sprintf
#endif

int main(int argc, char* argv[])
{
    const TRexChar *begin,*end;
    TRexChar sTemp[200];
    const TRexChar *error = NULL;
    TRex *x = trex_compile(_TREXC(

  "("
    "("
      "("
        "[A-P]|[R-U]|[WYZ]"
      ")"
      "("
        "[A-H]|[K-Y]"
      ")?"

      "[0-9]{1,2}"

      "([ABCEHMNPRTVWXY]?|GIR)"
     ")"

     "\\s{0,2}"
     "("
       "[0-9]"
       "("
        "[AB]|[D-H]|[JL]|[N-U]|[W-Z]"
       "){2}"
     ")"
   ")"),&error);

    if(x) {
        trex_sprintf(sTemp,_TREXC("A11AA"));
        if(trex_search(x,sTemp,&begin,&end))
        {
            int i,n = trex_getsubexpcount(x);
            TRexMatch match;
            for(i = 0; i < n; i++)
            {
                TRexChar t[200];
                trex_getsubexp(x,i,&match);
                trex_sprintf(t,_TREXC("[%%d]%%.%ds\n"),match.len);
                trex_printf(t,i,match.begin);
            }
            trex_printf(_TREXC("match! %d sub matches\n"),trex_getsubexpcount(x));
        }
        else {
            trex_printf(_TREXC("no match!\n"));
        }
        trex_free(x);
    }
    else {
        trex_printf(_TREXC("compilation error [%s]!\n"),error?error:_TREXC("undefined"));
    }
    return 0;
}

答案 1 :(得分:0)

通常,在调用“Bug!”之前,您必须检查三次。在编译器,库或其他工具上(开发人员可能知道他们在做什么,并测试他们的东西)。此外,你可以在公共场合骚扰自己; - )

AFAICS,你的“A11AA”字符串与给定的表达式不匹配,后者需要更多的东西。

尝试更简单的表达式,匹配字符串的部分并进行处理。检查表达式的确切含义(不同工具的语言非常不同)。