命名实体识别 - 标记工具

时间:2017-10-25 08:06:50

标签: nlp named-entity-recognition

是否有人建议在原始文本中为NER类型标记工具?

工具的输入应该是一个文本文件库(.txt简单格式),应该有一个方便的UI用于选择单词并设置标签/注释适合选择,输出应该是标签的结构表示(e.gs tart index,最后一个索引,JSON格式的标记)

3 个答案:

答案 0 :(得分:1)

LightTag的创始人

我们提供了一个超级方便的界面来进行跨度注释,例如命名实体识别,分类和关系。 您可以作为一个标签工作者或加入一个团队,LightTag会自动分散每个人之间的工作(不再选择文件并记住您已标记的内容)。 enter image description here

您可以上传自己的建议,让贴标签者使用它们,或者使用模型中内置的LightTag。 当然,您可以在字符级别进行注释并突出显示子词或多词短语。 enter image description here

答案 1 :(得分:0)

你可以尝试https://github.com/lasigeBioTM/MER(bash) 请参阅http://labs.fc.ul.pt/mer/

上的演示

答案 2 :(得分:0)

在线工具:

我猜Dataturks' POS工具应该适用于您的用例,您只需上传数据并指定标签即可。用户界面似乎很方便。

这是链接: https://dataturks.com

它是一个在线工具,因此您可以与多人合作完成标记。

不支持您要查找的确切输出格式,但格式可以轻松转换为您要查找的内容,输出如下:word___LABEL word2___LABEL,因此一个简单的2行脚本可以将其转换为start和结束指数。

<强>离线:

您可以查看的另一个工具是神童,它是一个可下载的软件并做类似的事情。只是你可能愿意为此付出代价。 https://prodi.gy