数据集训练MITIE ner模型

时间:2017-10-06 09:23:29

标签: python named-entity-recognition rasa-nlu

是否有任何现有数据集带有标记实体来训练MITIE ner模型? 我查看了链接https://github.com/mit-nlp/MITIE/blob/master/examples/python/train_ner.py,它只用两个样本训练模型。是否有任何现有数据集带有标记实体进行训练?

1 个答案:

答案 0 :(得分:2)

我一直在寻找类似的东西。仅用于“通用”(因此不是非常有用)的NLU后端。到目前为止,我唯一发现的是一个训练有素的模型,有9个新闻类别(不是很通用)。请参阅此处的博文:http://eric-yuan.me/ner_1/

如果您可以选择切换NER,则默认情况下,spaCy具有训练有素的模型。它的可视化前端可以通过google“displacy”

找到

如果您还有其他信息,请与我们联系!

编辑:花了一天时间研究这个,我想我已经找到了你想要的东西。如果你去https://github.com/mit-nlp/MITIE/releases那里你会发现MITIE自己的NER模型在维基百科,Freebase等上训练过。实际的训练数据集也在那里。其github页面上的README提供了有关如何使用预训练模型的示例。您还可以调查示例文件夹中的ner.py文件,以了解如何在python代码中使用预先训练的模型。