实体消歧的Yago本体论

时间:2014-09-24 03:49:53

标签: semantics ontology dbpedia virtuoso linked-data

我正在使用等于rdfs:type的专属dbpedia-owl:Organisation来选择(显然)我的SPARQL查询中的组织:

 SELECT ?s
 WHERE {
     ?s a dbpedia-owl:Organisation .
 } LIMIT 10

我想考虑YAGO本体,以提高我在获得真实组织方面的表现。例如,FBI(http://dbpedia.org/resource/Federal_Bureau_of_Investigation)不被视为dbpedia-owl:Organization,但标记为yago:Organization108008335。

注意"随机" (至少对我来说)班级名称末尾的数字。有谁知道这个号码代表什么?我怎么想先验一下呢?

此外,当我寻找更多具有此格式的课程时(使用下面的查询),我还可以找到另外两个课程:http://dbpedia.org/class/yago/Organization108008335http://dbpedia.org/class/yago/Organization101008378http://dbpedia.org/class/yago/Organization101136519

SELECT DISTINCT ?t WHERE {
    ?s a ?t
    FILTER(regex(str(?t), "http://dbpedia.org/class/yago/Organization\\d+"))
}

它们有什么不同吗?为什么他们都不是" yago:Organization"。我应该期待" new"组织课程作为YAGO本体的新版本可用?在选择组织时是否还应考虑其他课程?

1 个答案:

答案 0 :(得分:3)

我最近一直在深入研究,所以我会逐一回答你的所有问题:

  

注意班级名称末尾的“随机”(至少对我而言)号码。有谁知道这个号码代表什么?我怎么想先验一下呢?

该数字对应于Wordnet中单词的synset id。例如,如果你在wordnet中查找wordnet_organization_101136519(此时dbpedia中的URI无法解析,也许他们在最后一个版本中已经改变了一些内容),你会看到它有一个synsetID“101136519”。我不认为你可以在不查看wordnet的情况下先了解它。

  

它们有什么不同吗?为什么他们都不是“yago:组织”。

它们不同,因为它们在wordnet中有不同的定义。例如:

  

wordnet_organization_101136519:“正确或有条不紊地分配或处置人员或事物的活动或结果'他的组织工作人员非常有效'”。实例示例:Bogo-Indian_Defence。查看更多详情here

     

wordnet_organization_101008378:“组织企业或与企业相关的活动的行为'他被带入监督新部门的组织'”。实例示例:Adam_Smith_Foundation。查看更多详情here

如果您按照我提供的链接,您可以看到更多的差异和常见的相似之处。

  

我是否应该期待“新”组织类作为YAGO本体的新版本?

当他们生成Yago时,他们将wordnet中的每个单词与URI相关联。如果添加更多关于组织的文字,那么我猜你会有更多的定义。但事先不可能知道。

  

在选择组织时,我还应该考虑其他课程吗?

您可以在wordnet中查找标签为“organization”的所有类,然后在查询中添加选项(或者每个类发出一个查询,检索您感兴趣的不同组织)。 These are the classes with the "organization" label in Wordnet

我希望它有所帮助。