请帮我改进以下语法

时间:2012-08-01 14:27:04

标签: jquery parsing bison flex-lexer

您可以帮我找出下面代码中我出错的地方 - (或者指向我可以找到/学习的地方)。

弹性输入 -

%{
        #include "jq.tab.h"
        void yyerror(char *);
%}
method          add|map|.. and other methods go here

%%

"/*"            { return CS; }

"*/"            { return CE; }

"jQuery"        {
                printf("%s is yytext\n", yytext);
                return *yytext;
                }

"args"          { return ARGUMENT; }

{method}        { return METHOD; }

[().\n]         { return *yytext; }

[ \t]+          { return WS; }

.               { return IGNORE; }

%%

int yywrap(void) {
        return 1;
}

野牛输入 -

%{
        #include <stdio.h>
        int yylex(void);
        void yyerror(char *);
%}

%token ARGUMENT METHOD IGNORE WS CS CE
%error-verbose

%%

stmts:
        stmt '\n'               { printf("A single stmt\n"); }
        | stmt '\n' stmts       { printf("Multi stmts\n"); }
        ;

stmt:
        jQuerycall                      { printf("A complete call ends here\n"); }
        | ignorechars                   { printf("Ignoring\n"); }
        | ignorechars WS jQuerycall     { printf("ignore+js\n"); }
        | jQuerycall WS ignorechars     { printf("js+ignore\n"); }
        | optionalws stmt optionalws
        | CS stmt CE                    { printf("comment\n"); }
        ;

jQuerycall:
        'jQuery' '(' ARGUMENT ')' '.' methodchain       { printf("args n methodchain\n"); }
        | 'jQuery' '(' ')' '.' methodchain              { printf("methodchain\n"); }
        | 'jQuery' '(' ARGUMENT ')'                     { printf("args\n"); }
        | 'jQuery' '(' ')'                              { printf("empty call\n"); }
        ;

methodchain:
        methodchain '.' methodcall
        | methodcall
        ;

methodcall:
        METHOD '(' ')'
        ;

ignorechars:
        IGNORE
        | IGNORE optionalws ignorechars
        ;

optionalws:
        | WS
        ;

%%

void yyerror(char *s) {
        fprintf(stderr, "%s\n", s);
}

int main(void) {
        yyparse();
        return 0;
}

目标是识别任何带有所有元素的jQuery调用..并忽略任何其他语句/字符串。也忽略评论..现在,这段代码做了很多假设 - 比如'args'是jQuery()中唯一的选择元素

[编辑] 请看看下面的输入输出案例。像10和12这样的案例是我想弄清楚的..

> 1.input: statement\n output: Ignoring
> 
> 2.input: statement statement\n output: Ignoring
> 
> 3.input: statement statement statement\n output: Ignoring
> 
> 4.input: jQuery()\n output: jQuery is yytext empty call A complete call ends here
> 
> 5.input: jQuery(args)\n output: jQuery is yytext args A complete call ends here
> 
> 6.input: jQuery().add()\n output: jQuery is yytext methodchain A complete call ends here
> 
> 7.input: jQuery(args).add().map()\n output: jQuery is yytext args n methodchain A complete call ends here
> 
> 8.input: /*comment*/\n output: Ignoring comment
> 
> 9.input: /*jQuery()*/\n output: jQuery is yytext empty call A complete call ends here comment
> 
> 10.input: /* comment */\n output: syntax error, unexpected CE, expecting IGNORE
> 
> 11.input: var a = b\n output: Ignoring
> 
> 12.input: var a = jQuery(args)\n output: jQuery is yytext syntax error, unexpected 'jQuery', expecting IGNORE

非常感谢!!

2 个答案:

答案 0 :(得分:0)

在你的lex文件中,规则是:

"jQuery"        {
                printf("%s is yytext\n", yytext);
                return *yytext;
                }

在看到jQuery的输入字符串时返回标记'j'。由于你的bison文件永远不会对令牌'j'做任何事情,这通常会给你一个语法错误。

您需要在JQUERY声明中添加%token,并让此词法规则返回。

修改

通常评论可以出现在程序的任何地方(任何两个其他令牌之间)并完全被忽略。所以处理它们的最简单方法是词法分析器:

%x comment
%%
"/*"           { BEGIN comment; }
<comment>.     ;
<comment>"*/"  { BEGIN 0; }

这将跳过评论(根本不返回任何标记),因此语法不需要担心它们。如果您不想使用词法分析器启动状态,则可以使用复杂的正则表达式:

"/*"([^*]|\*+[^*/])*\*+"/"          ;

答案 1 :(得分:0)

我想我可以给你一个解决案例10的解决方案,但是存在更深层次的问题。

由于案例8为您提供了您期望的结果,我推断出输入

/*comment*/

被产品认可

stmt: CS stmt CE

也就是说字符串“comment”被识别为stmt。但是当你在CSstmt之间添加空格时,解析失败了,这就是你的情况10.你可以通过重写你的作品来补丁这个

stmt: CS optionalws stmt optionalws CE

但更深层次的问题是您的解析器无法识别其他评论,例如

/* This is a remarkable remark, isn't it? */ 

/**
 * This is a multi-line comment.
 */