我想解析一个有序列表,类似于:
I - Something
II - Something else...
IX - Something weird
XIII - etc
到目前为止,我的树梢语法是:
rule text
roman_numeral separator text newline
end
rule roman_numeral
&. ('MMM' / 'MM' / 'M')? (('C' [DM]) /
('D'? ('CCC' / 'CC' / 'C')?))? (('X' [LC]) /
('L'? ('XXX' / 'XX' / 'X')?))? (('I' [VX]) /
('V'? ('III' / 'II' / 'I')?))?
end
rule separator
[\s] "-" [\s]
end
rule text
(!"\n" .)*
end
rule newline
["\n"]
end
但是,相应的解析器无法解析文本。什么坏了?
答案 0 :(得分:3)
您意外超载text
。将第一个重命名为line
,然后为lines
添加另一个规则。
新行周围的报价似乎也没必要。
提示 - 您可以重复使用newline
规则中的text
规则,以使其保持干燥状态。
grammar Roman
rule lines
line*
end
rule line
roman_numeral separator text newline
end
rule roman_numeral
&. ('MMM' / 'MM' / 'M')? (('C' [DM]) /
('D'? ('CCC' / 'CC' / 'C')?))? (('X' [LC]) /
('L'? ('XXX' / 'XX' / 'X')?))? (('I' [VX]) /
('V'? ('III' / 'II' / 'I')?))?
end
rule separator
[\s] "-" [\s]
end
rule text
(!newline .)*
end
rule newline
[\n]
end
end
您可以通过删除否定前瞻和单个字符类来简化语法。
rule separator
" - "
end
rule text
[^\n]*
end
生成的语法图变得更加简单。