提取由一组节点引起的子图

时间:2013-10-10 07:15:58

标签: rdf sparql jena virtuoso

给出对象和有向关系的通用图:

@prefix obj: <http://example.org/obj/> .
@prefix rel: <http://example.org/rel/> .

obj:obj1 rel:rel1 obj:obj2 .
obj:obj3 rel:rel2 obj:obj2 .
obj:obj9 rel:rel5 obj:obj8 .
obj:obj1 rel:rel1 obj:obj3 .

和一个对象的子集,比如obj1, obj2, obj3,如何使用简单的SPARQL查询提取仅包含此对象子集的子图,而不管完整图中的特定关系?生成的子图应为:

obj:obj1 rel:rel1 obj:obj2 .
obj:obj3 rel:rel2 obj:obj2 .
obj:obj1 rel:rel1 obj:obj3 .

我目前的尝试是尝试使用一堆OPTIONAL子句尝试所有可能的关系,这可能不是最好的方法:

SELECT ?r1 ?r2 ?r3 ?r4 ?r5 ?r6 WHERE {
OPTIONAL {obj:obj1 ?r1 obj:obj2} .
OPTIONAL {obj:obj1 ?r2 obj:obj3} .
OPTIONAL {obj:obj2 ?r3 obj:obj3} .
OPTIONAL {obj:obj2 ?r4 obj:obj1} .
OPTIONAL {obj:obj3 ?r5 obj:obj1} .
OPTIONAL {obj:obj3 ?r6 obj:obj2} . }

1 个答案:

答案 0 :(得分:5)

鉴于这些数据(基本上属于你的数据,除了我在行的末尾添加了.以便它是有效的Turtle,并且我添加了几个三元组以便我们'能够看到只有特定集合中的主题或对象是否会使结果中的三元组保持不变):

@prefix obj: <http://example.org/obj/> .
@prefix rel: <http://example.org/rel/> .

obj:obj1 rel:rel1 obj:obj2 .
obj:obj3 rel:rel2 obj:obj2 .
obj:obj1 rel:rel4 obj:obj8 . # additional triple
obj:obj9 rel:rel7 obj:obj2 . # additional triple
obj:obj9 rel:rel5 obj:obj8 .
obj:obj1 rel:rel1 obj:obj3 .

你可以使用这样的查询:

prefix obj: <http://example.org/obj/>

select ?s ?p ?o where { 
  values ?s { obj:obj1 obj:obj2 obj:obj3 }
  values ?o { obj:obj1 obj:obj2 obj:obj3 }
  ?s ?p ?o .
}

得到这样的结果:

$ sparql --query query.rq --data data.n3
----------------------------------
| s        | p        | o        |
==================================
| obj:obj1 | rel:rel1 | obj:obj3 |
| obj:obj1 | rel:rel1 | obj:obj2 |
| obj:obj3 | rel:rel2 | obj:obj2 |
----------------------------------

这里使用values只是说?s必须从一组特定的值中提取,而?o必须从一组特定的值中提取。我认为没有办法避免在每个地点重复特殊资源清单。也就是说,你必须写两次{ obj:obj1 obj:obj2 obj:obj3 },但这比枚举所有可能的组合要容易得多。

如果您想要的内容实际上是图形,而不是一组变量绑定,您也可以考虑在此使用construct,而不是select。例如,使用此查询:

prefix obj: <http://example.org/obj/>

construct { ?s ?p ?o } where { 
  values ?s { obj:obj1 obj:obj2 obj:obj3 }
  values ?o { obj:obj1 obj:obj2 obj:obj3 }
  ?s ?p ?o .
}

您可以获得实际的RDF图表:

$ sparql -out TTL --query query.rq --data data.n3
@prefix obj:   <http://example.org/obj/> .
@prefix rel:   <http://example.org/rel/> .

obj:obj1  rel:rel1  obj:obj3 , obj:obj2 .

obj:obj3  rel:rel2  obj:obj2 .
$ sparql -out N-Triples --query query.rq --data data.n3
<http://example.org/obj/obj1> <http://example.org/rel/rel1> <http://example.org/obj/obj3> .
<http://example.org/obj/obj1> <http://example.org/rel/rel1> <http://example.org/obj/obj2> .
<http://example.org/obj/obj3> <http://example.org/rel/rel2> <http://example.org/obj/obj2> .
$ sparql -out RDF/XML --query query.rq --data data.n3
<rdf:RDF
    xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
    xmlns:obj="http://example.org/obj/"
    xmlns:rel="http://example.org/rel/">
  <rdf:Description rdf:about="http://example.org/obj/obj1">
    <rel:rel1>
      <rdf:Description rdf:about="http://example.org/obj/obj3">
        <rel:rel2 rdf:resource="http://example.org/obj/obj2"/>
      </rdf:Description>
    </rel:rel1>
    <rel:rel1 rdf:resource="http://example.org/obj/obj2"/>
  </rdf:Description>
</rdf:RDF>