如何向Mallet SimpleTagger添加单词级功能?

时间:2018-01-08 05:50:49

标签: nlp mallet

我一直在浏览this blog post,其中包含一个SimpleTagger示例。

它说:

给定一个输入文件" sample"如下:

CAPITAL Bill  noun
        slept non-noun
        here non-noun
where all but the last token on each line is a binary feature, and the last token on the line is the label name

那么,如何在此处添加字级功能?

示例:单词中的音节数,单词的长度等

1 个答案:

答案 0 :(得分:1)

最后一个令牌之前的所有内容都被视为一项功能。您应该可以在此之前添加任意功能:

CAP SYL1 CHAR4 Bill noun
SYL3 CHAR9 responded non-noun
...