FLEX上的“无法识别的规则”和“致命的解析错误”

时间:2017-01-07 18:34:50

标签: python parsing bison flex-lexer

我必须使用flex和bison为简化的Python 3制作一个解析器,并且我得到了这两个错误。终端说它们是我写的78中的第79行。我有其他'.l'示例来自类,具有这种格式,它们工作正常

这就是我写的

    %option noyywrap

%{ 
#define YYSTYPE double
#include "scanner.tab.h"
#include <stdlib.h>
#include <string>

extern int flag;
extern int line;
%}

DELIMITER    [ ]+|[/t]+

KEYWORD      False|class|finally|is|return|None|continue|for|lambda|try|True|def|from|nonlocal|while|and|del|global|not|with|as|elif|if|or|yield|assert|else|import|pass|break|except|in|raise

OPERATOR     ([+\-$@&|^~])|(\*{1,2})|(\/{1,2})|(<[=<]?)|(>[=>]?)|(==)|!

COMMENT      #.+

IDENTIFIER   [a-zA-Z_][a-zA-Z0-9_]*
ID_ERR       [0-9]{IDENTIFIER}

STRINGESCAPESEQ  [\\].  
SHORTSTRINGCHAR1 [^\\'\n]*
SHORTSTRINGCHAR2 [^\\"\n]*
SHORTSTRINGITEM1 {SHORTSTRINGCHAR1}|{STRINGESCAPESEQ}
SHORTSTRINGITEM2 {SHORTSTRINGCHAR2}|{STRINGESCAPESEQ}
STRING       [']{SHORTSTRINGITEM1}*[']|(["]{SHORTSTRINGITEM2}*["])
STRING_ERR   ['].[^'\n\t]*|["].[^"\n\t]* 

BINDIGIT     [01]
BININTEGER   0[bB]{BINDIGIT}+
BIN_ERR1     0[Bb]+{BINDIGIT}+

DIGIT        [0-9]
NONZERODIGIT     [1-9]
INTEGER      {NONZERODIGIT}{DIGIT}*|[0]+
INT_ERR1     {INTEGER}[a-zA-Z]{DIGIT}
INT_ERR2     [-+]{INTEGER}
INT_ERR3     [0+]{INTEGER}

INTPART      {DIGIT}+
EXPONENT     [eE][+-]*{INTPART}
FRACTION     [\.]{INTPART}
EXPONENTFLOAT    ({INTPART}|{POINTFLOAT}){EXPONENT}
POINTFLOAT   {INTPART}*{FRACTION}|{INTPART}[\.]
FLOATNUMBER  {POINTFLOAT}|{EXPONENTFLOAT}
FLOAT_ERR_POINT  {INTPART}*[\.]+{DIGIT}+[\.]*{DIGIT}*|{INTPART}[\.]+
FLOAT_ERR_SIGN   ([-+]{FLOATNUMBER})
FLOAT_ERR_LETTER {FLOATNUMBER}[A-Za-z]+

IMAGINARYNUMBER  ({FLOATNUMBER}|{INTPART})[jJ]

%%

{DELIMITER}     { }
{KEYWORD}       { return KEYWORD; }
{OPERATOR}      { }
{COMMENT}       { printf("Line %d: Found COMMENT\n", line); }   
{IDENTIFIER}        { printf("Line %d: Found IDENTIFIER %s\n", line, yytext);                    return IDENTIFIER; }
{ID_ERR}        { printf("Line %d: !!ERROR!!\tWrong IDENTIFIER statement %s\n", line, yytext);           return ID_ERR;}  
{STRING}        { printf("Line %d: Found STRING %s\n", line, yytext);                        return STRING; }
{STRING_ERR}        { printf("Line %d: !!ERROR!!\tWrong STRING statement %s\n", line, yytext);           return STRING_ERR;}
{BININTEGER}        { printf("Line %d: Found BINARY INTEGER NUMBER %s\n", line, yytext);                 return BININTEGER; }
{BIN_ERR1}      { printf("Line %d: !!ERROR!!\tWrong BINARY NUMBER statement, too many 'Bb's%s\n", line, yytext); return BIN_ERR1;}
{INTEGER}       { printf("Line %d: Found INTEGER NUMBER %s\n", line, yytext);                    return INTEGER; }
{INT_ERR1}      { printf("Line %d: !!ERROR!!\tWrong INT statement %s\n", line, yytext);              return INT_ERR1;}
{INT_ERR2}      { printf("Line %d: !!ERROR!!\tWrong INT statement, '+/-' found %s\n", line, yytext);         return INT_ERR2;}
{INT_ERR3}      { printf("Line %d: !!ERROR!!\tWrong INT statement, first digit(s) zeros %s\n", line, yytext);    return INT_ERR3;}
{FLOATNUMBER}       { printf("Line %d: Found FLOAT NUMBER %s\n", line, yytext);                  return FLOATNUMBER; }
{FLOAT_ERR_POINT}   { printf("Line %d: !!ERROR!!\tWrong FLOAT statement, too many '.' %s\n", line, yytext);      return FLOAT_ERR_POINT;}
{FLOAT_ERR_POINT}   { printf("Line %d: !!ERROR!!\tWrong FLOAT statement, '+/-' FOUND %s\n", line, yytext);       return FLOAT_ERR_SIGN;}
{FLOAT_ERR_LETTER   { printf("Line %d: !!ERROR!!\tWrong FLOAT statement, letter FOUND %s\n", line, yytext);      return FLOAT_ERR_LETTER;}
{IMAGINARYNUMBER}   { printf("Line %d: Found IMAGINARY NUMBER %s\n", line, yytext);                  return IMAGINARYNUMBER; }
.           { printf("Line %d: UNKNOWN TOKEN:%s", line, yytext);    BEGIN(error);}
\n                  { line++; }
<<EOF>>         { printf("#END OF FILE\n"); exit(0); }

完整的错误输出:

 flex scanner.l
 scanner.l:79: unrecognized rule
 scanner.l:79: fatal parse error

1 个答案:

答案 0 :(得分:3)

第74行末尾有一个缺失的括号:

{FLOAT_ERR_LETTER   { printf("Line %d: !!ERROR!!\tWrong FLOAT statement, letter FOUND %s\n", line, yytext);      return FLOAT_ERR_LETTER;}
                 ^  <--- here

模糊地试图让这个答案对未来的读者有用,因为问题是一个简单的错字,这就是我发现问题的方法:

for n in {57..79}; do head -n$n g.l | flex -o /dev/null -w || { echo $n; break; } done

大多数情况下,flex输入结束后线上的致命错误是缺少大括号或其他类似问题的结果,但校对整个文件是一件痛苦的事情,令人惊讶的是很少有IDE正确的语法颜色flex文件。所以像上面这样的技巧可以节省大量时间。 (它并不总是那么简单;在这种情况下,没有任何行动跨越多条线。)

修复该错误后,您会发现无法匹配多个模式。第73行无法匹配,因为该模式与第72行({FLOAT_ERR_POINT})相同。第65行和第66行(BININTEGERBIN_ERR1)无法匹配,因为相关模式(0B后跟数字)也匹配IDERR,这是(好奇地) )一个数字后跟一个标识符。 (您可能意味着[[:digit:]]+{IDENTIFIER}。)总的来说,您应该在最后放置错误模式,以便它们永远不会优先于正确令牌的模式。这也使编写错误令牌变得更加简单。 (此外,您需要在更一般的错误模式之前添加特定的错误模式,以便BIN_ERR1应该在IDERR之前。)

其他一些评论:

如果要观看弹性匹配模式,请在命令行中添加--debug(或-d),而不是在代码中添加printf命令。它可以更好地向您显示正在发生的事情,并且无需编辑整个文件即可打开和关闭。

&LT;&意见GT; 总的来说,在输入文件中过度使用flex宏并不是很有用。它实际上使得规范更难阅读,因为您必须查找宏的每次使用。就个人而言,我只需要在需要多次使用宏时使用宏,如果只是隐藏内置字符类(如[[:digit:]])的话,我就不会使用宏。 &LT; /&意见GT;

相关问题