在使用crfsuite时,如何使用先前令牌的实体类作为NER的功能

时间:2015-07-02 22:57:03

标签: python named-entity-recognition crf crf++

我在python中使用python-crfsuite包,由Naoaki Okazaki开发的CRFSUITE实现(http://www.chokkan.org/software/crfsuite/

我想使用先前标记的实体类作为特征,这将帮助我识别多字命名实体。 我的训练数据示例:

[(拉希加信息技术,B-助洗剂),(远景,I-助洗剂),(是,O),(非常,O),(著名,O)]

这里,如果我可以在训练时使用以前的类功能。但是在预测时我们将功能列表传递给tagger对象。 测试时的问题是前一课不知道。

任何人都可以在python-crfsuite中告诉我这是否可行。 我觉得我们将功能传递给tagger对象的方式是不可能的。

1 个答案:

答案 0 :(得分:0)

我认为使用crfsuite(和python-crfsuite)是不可能的,基于tutorial中的这句话:

  

不支持使用属性和标签双字母包围的功能。