CRF ++中的单词

时间:2013-03-20 09:53:12

标签: crf++

CRF ++模板文件中的词袋功能的语法是什么?

模板示例:

#Unigrams
U00:%x[0,0]
U01:%x[0,1]
U02:%x[1,0]

#Bigrams
B

3 个答案:

答案 0 :(得分:0)

我认为就是这样:

#Unigrams
U00:%x[0,0]
U00:%x[0,1]
U00:%x[1,0]

#Bigrams
B

使用相同的标识符。

答案 1 :(得分:0)

词袋的语法可能是这样的:

#Unigrams
U00:%x[0,0]/%x[0,1]/%x[1,0]

#Bigrams
B

Description of CRF++ using a template of CoNLL 2000 for bag-of-words

答案 2 :(得分:0)

这是使用Bag of(3)单词的正确模板:

#Unigrams
U00:%x[-1,0]
U00:%x[0,0]
U00:%x[1,0]

#Bigrams
B

请注意,标识符相同(U00)。

[-1,0] -> previous word
[0,0] -> current word
[1,0] -> next word