空间命名实体识别问题

时间:2019-05-28 15:44:12

标签: python nlp spacy

我正在尝试从我正在解析的一堆文本中标记ORG

到目前为止,我的情况如下:

import spacy
import en_core_web_sm
nlp = en_core_web_sm.load()

file = open("C:\\sample.txt")

doc = nlp(file.read())
print([(X.text, X.label_) for X in doc.ents])

现在,我的结果将打印所有可能的标签,我只希望它打印ORG。有关如何执行此操作的任何建议?

1 个答案:

答案 0 :(得分:2)

X.label_拥有实体的名称,因此您需要添加一个条件以仅返回X.label_等于ORG的那些元组:

print([(X.text, X.label_) for X in doc.ents if X.label_ == "ORG"])
#                                           ^------------------^