使用Jena 2.12.1加载模型时出现RiotException

时间:2015-02-13 08:23:29

标签: rdf jena dbpedia

我创建了这个名为 RDFReader 的简单类,用于从DBpedia的URI加载模型:

import com.hp.hpl.jena.rdf.model.Model;
import com.hp.hpl.jena.util.FileManager;

public class RDFReader {
    public static Model readFromURL(String URL){
      try{
         return (new FileManager()).loadModel(URL);
      }catch(Exception e){
         e.printStackTrace();
      }
      return null;  
     }

    public static void main(String[] args) {
      RDFReader.readFromURL("http://dbpedia.org/resource/Pacific_Rim_(film)");
    }   
}

我使用了 Jena v2.12.1,如下面的pom.xml片段所示

    <dependency>
        <groupId>org.apache.jena</groupId>
        <artifactId>jena-core</artifactId>
        <version>2.12.1</version>
    </dependency>
    <dependency>
        <groupId>org.apache.jena</groupId>
        <artifactId>jena-arq</artifactId>
        <version>2.12.1</version>
    </dependency>
    <dependency>

通过使用 Jena v2.12.1运行此代码,我得到了下一个例外:

org.apache.jena.riot.RiotException: [line: 21, col: 17] Unknown char: –(8211;0x2013)
at org.apache.jena.riot.system.ErrorHandlerFactory$ErrorHandlerStd.fatal(ErrorHandlerFactory.java:136)
at org.apache.jena.riot.lang.LangEngine.raiseException(LangEngine.java:163)
at org.apache.jena.riot.lang.LangEngine.nextToken(LangEngine.java:106)
at org.apache.jena.riot.lang.LangTurtleBase.triples(LangTurtleBase.java:249)
at org.apache.jena.riot.lang.LangTurtleBase.triplesSameSubject(LangTurtleBase.java:191)
at org.apache.jena.riot.lang.LangTurtle.oneTopLevelElement(LangTurtle.java:44)
at org.apache.jena.riot.lang.LangTurtleBase.runParser(LangTurtleBase.java:90)
at org.apache.jena.riot.lang.LangBase.parse(LangBase.java:42)
at org.apache.jena.riot.RDFParserRegistry$ReaderRIOTLang.read(RDFParserRegistry.java:182)
at org.apache.jena.riot.RDFDataMgr.process(RDFDataMgr.java:906)
at org.apache.jena.riot.RDFDataMgr.parse(RDFDataMgr.java:687)
at org.apache.jena.riot.RDFDataMgr.read(RDFDataMgr.java:210)
at org.apache.jena.riot.RDFDataMgr.read(RDFDataMgr.java:183)
at org.apache.jena.riot.RDFDataMgr.read(RDFDataMgr.java:121)
at org.apache.jena.riot.RDFDataMgr.read(RDFDataMgr.java:112)
at org.apache.jena.riot.adapters.RDFReaderRIOT.read(RDFReaderRIOT.java:77)
at com.hp.hpl.jena.rdf.model.impl.ModelCom.read(ModelCom.java:253)
at com.hp.hpl.jena.util.FileManager.readModelWorker(FileManager.java:377)
at com.hp.hpl.jena.util.FileManager.loadModelWorker(FileManager.java:308)
at com.hp.hpl.jena.util.FileManager.loadModel(FileManager.java:260)
at edu.polito.rdf.utils.RDFReader.readFromURL(RDFReader.java:12)
at edu.polito.rdf.utils.RDFReader.main(RDFReader.java:20)

然而,使用 Jena v2.11.0,代码运行没有任何问题。所以我想知道:

  1. 为什么 Jena 的2.12.1版本会产生此错误?
  2. 是否可以使用2.12.1版本的 Jena 而不是2.11.0来解决此问题?
  3. 顺便说一句,我正在使用 eclipse Luna 4.4.1 和java版本“1.8.0_11”。

1 个答案:

答案 0 :(得分:0)

问题是我试图访问资源http://dbpedia.org/resource/Pacific_Rim_(film),其中包含一个在Turtle中不合法的字符0x2013(Em-dash)。

这些是两个问题的答案:

  1. 我使用Jena 2.12.1,它应用内容协商并在RDF / XML之前列出Turtle,因此它发现DBpedia中的资源(使用Turtle)是错误的(如前所述)。对于版本2.11.0,它运行没有问题,因为该版本有一个错误,允许解析器是宽松的。然后在版本2.12.1中修复了此错误,因此读取具有非法字符的资源会启动RiotException。

  2. 解决方案只是向DBpedia询问可以通过http://dbpedia.org/data/Pacific_Rim_(film).rdf访问的资源的RDF / XML(或N-triples)。从DBpedia获取RDF / XML的最终代码是:

  3. 注意:根据@AndyS的建议,我使用了RDFDataMgr.loadModel(String URI)

    import com.hp.hpl.jena.rdf.model.Model;
    import com.hp.hpl.jena.util.FileManager;
    
    public class RDFReader {
       public static Model readFromURL(String URL){
            return RDFDataMgr.loadModel(URL);
       }
    
       public static void main(String[] args) {
            Model model =      RDFReader.readFromURL("http://dbpedia.org/data/Pacific_Rim_(film).rdf");
         }
    }