标识符Lexer规则与它应该的'*'不匹配

时间:2015-11-26 12:37:25

标签: antlr4

我正在完成专有模式语言的语法定型。它借用了一些正则表达式语法元素(如量词),但它也比正则表达式复杂得多,因为它必须允许宏,不同的模式样式等。

我的问题是'*'与ID lexer规则不匹配。就我所见,没有其他规则可以吞下*令牌。

这是我写的语法:

grammar Pattern;

element:
        ID
        | macro;

macro:
        MACRONAME macroarg? ('*'|'+'|'?'|FROMTIL)?;

macroarg: '['( (element | MACROFREE ) ';')* (element | MACROFREE) ']';


and_con :
        element '&' element
        | and_con '&' element
        |'(' and_con ')';

head_con :
        'H[' block '=>' block ']';

expression :
        element
        | and_con
        | expression ' ' element
        | '(' expression ')';

block :
        element
        | and_con
        | or_con
        | '(' block ')';

blocksequence :
        (block ' '+)* block;

or_con :
         ((element | and_con) '|')+ (element | and_con)
        | or_con '|' (element | and_con)
        | '(' blocksequence (')|(' blocksequence)+ (')'|')*');

patternlist :
        (blocksequence ' '* ',' ' '*)* blocksequence;

sentenceord :
        'S=(' patternlist ')';

sentenceunord :
        'S={' patternlist '}';

pattern :
        sentenceord
        | sentenceunord
        |  blocksequence;      

multisentence :
        MS pattern;

clause :
        'CLS' ' '+ pattern;

complexpattern :
        pattern
        | multisentence
        | clause
        | SECTIONS ' ' complexpattern;

dictentry:
        NUM ';' complexpattern
        | NUM ';' NAME ';' complexpattern
        | COMMENT;

dictionary:
        (dictentry ('\r'|'\n'))* (dictentry)?;

ID : '*' ('*'|'+'|'?'|FROMTIL)?
        | ( '^'? '!'? ('F'|'C'|'L'|'P'|'CA'|'N'|'PE'|'G'|'CD'|'T'|'M'|'D')'=' NAME ('*'|'+'|'?'|FROMTIL)? '$'? );

MS : 'MS' [0-9];

SECTIONS: 'SEC' '=' ([0-9]+','?)+;

FROMTIL: '{'NUM'-'NUM'}';

NUM: [0-9]+;

NAME: CHAR+ | ',' | '.' | '*';

CHAR: [a-zA-Z0-9_äöüßÄÖÜ\-];

MACRONAME: '#'[a-zA-Z_][a-zA-Z_0-9]*;

MACROFREE: [a-zA-Z!]+;

COMMENT: '//' ~('\r'|'\n')*;

complexpattern / pattern / element / block解析器规则应该接受一个简单的'*',我无法弄清楚它们为什么没有。

1 个答案:

答案 0 :(得分:0)

在您的eval()规则中,您定义了文字macro,导致'*'规则与单个ID匹配作为输入。