请帮助我理解命名实体识别和命名实体提取之间的区别。
答案 0 :(得分:1)
命名实体识别是对实体(人,地,组织)的表面形式的认可,即#34; George Bush"或者"巴拉克奥巴马"是" PERSON"此文本字符串中的实体。
实体提取将从文本字符串中提取附加信息作为属性。例如在句子中,乔治·W·布什在奥巴马总统面前担任总统。承认"奥巴马"作为具有属性" title = president"的人。
但是,如果你看一下软件,区别往往是模糊的。
答案 1 :(得分:0)
没有命名实体提取这样的东西 更好地解释句子我会说命名实体提取很简单,具体提取先前识别的命名实体的过程。因此,从某种意义上说,没有与此任务相关的真正理论知识,只是定义机械操作的问题。
如果我们有兴趣从文本中提取所有特定实体或有关它们的其他信息,那么我们必须查看信息或知识提取。
对于信息提取,您可以例如要求提取出现在文档语料库中的所有城市名称或电子邮件地址。对于这样的任务,可以使用命名实体提取。你甚至可以更通用,只是简单地提取一般知识,例如以关系(关系提取)的形式。
有关详细信息,我建议使用本书Artificial Intelligence: A Modern Approach中的自然语言处理章节。