我正在尝试从我正在解析的一堆文本中标记ORG
到目前为止,我的情况如下:
import spacy
import en_core_web_sm
nlp = en_core_web_sm.load()
file = open("C:\\sample.txt")
doc = nlp(file.read())
print([(X.text, X.label_) for X in doc.ents])
现在,我的结果将打印所有可能的标签,我只希望它打印ORG。有关如何执行此操作的任何建议?
答案 0 :(得分:2)
X.label_
拥有实体的名称,因此您需要添加一个条件以仅返回X.label_
等于ORG
的那些元组:
print([(X.text, X.label_) for X in doc.ents if X.label_ == "ORG"])
# ^------------------^