适用于RDF Feed的Android SAX Parser

时间:2013-03-23 10:22:23

标签: android rss rdf saxparser

我在尝试解析RDF提要(Android解析器上的新手)时已经完全停留了几天。尽管使用:

Element item = root.getChild("", ITEM);

因为我的项目来自根而不是CHANNEL,因为已指定here。无论如何,我只检索0条消息

<?xml version="1.0" encoding="utf-8" ?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
     xmlns:dc="http://purl.org/dc/elements/1.1/"
     xmlns:syn="http://purl.org/rss/1.0/modules/syndication/"
     xmlns="http://purl.org/rss/1.0/">
<channel rdf:about="http://...">
    <title>Notícies</title>
    <link>...</link>
    <description></description>
        <syn:updatePeriod>daily</syn:updatePeriod>
        <syn:updateFrequency>1</syn:updateFrequency>
        <syn:updateBase>2009-08-25T16:01:24Z</syn:updateBase>
        <image rdf:resource="..."/>
        <items>
            <rdf:Seq>
            <rdf:li rdf:resource="..."/>
            <rdf:li rdf:resource="..."/>
            </rdf:Seq>
        </items>
        </channel>

<item rdf:about="...">        
   <title>...</title>        
   <link>....</link>        
   <description>...</description>        
   <dc:publisher>No publisher</dc:publisher>
   <dc:creator>administrador</dc:creator>
   <dc:rights></dc:rights>                
   <dc:date>2013-03-22T16:18:36Z</dc:date>        
   <dc:type>Noticia</dc:type>    
</item>
<item rdf:about="...">        
   <title>...</title>        
   <link>....</link>        
   <description>...</description>        
   <dc:publisher>No publisher</dc:publisher>
   <dc:creator>administrador</dc:creator>
   <dc:rights></dc:rights>                
   <dc:date>2013-03-22T16:18:36Z</dc:date>        
   <dc:type>Noticia</dc:type>    
</item>
<item rdf:about="...">        
   <title>...</title>        
   <link>....</link>        
   <description>...</description>        
   <dc:publisher>No publisher</dc:publisher>
   <dc:creator>administrador</dc:creator>
   <dc:rights></dc:rights>                
   <dc:date>2013-03-22T16:18:36Z</dc:date>        
   <dc:type>Noticia</dc:type>    
</item>
 ...

</rdf:RDF>

使用我的SAX Parser如下:

public class AndroidSaxFeedParser extends BaseFeedParser {


    static final String RDF_NAMESPACE = "http://www.w3.org/1999/02/22-rdf-syntax-ns#";
    static final String ATOM_NAMESPACE = "http://www.w3.org/2005/Atom";
    static final String RSS_NAMESPACE = "";

    static final String RSS = "RDF";
    public AndroidSaxFeedParser(String feedUrl) {
        super(feedUrl);
    }

    public List<Message> parse() {
        final Message currentMessage = new Message();
        //RootElement root = new RootElement(RSS);
        RootElement root = new RootElement(RDF_NAMESPACE, RSS);
        final List<Message> messages = new ArrayList<Message>();

        //Element channel = root.getChild(CHANNEL);
        //Element channel = root.getChild(RDF_NAMESPACE, CHANNEL);
        Log.e("Valor Root", root.toString());

        Element item = root.getChild("", ITEM);
        //Element item = channel.getChild(RDF_NAMESPACE,ITEM);
        item.setEndElementListener(new EndElementListener(){
            public void end() {
                messages.add(currentMessage.copy());
            }
        });
        item.getChild(TITLE).setEndTextElementListener(new EndTextElementListener(){
            public void end(String body) {
                currentMessage.setTitle(body);
            }
        });
        item.getChild(LINK).setEndTextElementListener(new EndTextElementListener(){
            public void end(String body) {
                currentMessage.setLink(body);
            }
        });
        item.getChild(DESCRIPTION).setEndTextElementListener(new EndTextElementListener(){
            public void end(String body) {
                currentMessage.setDescription(body);
            }
        });
        item.getChild(PUB_DATE).setEndTextElementListener(new EndTextElementListener(){
            public void end(String body) {
                currentMessage.setDate(body);
            }
        });
        try {
            Xml.parse(this.getInputStream(), Xml.Encoding.UTF_8, root.getContentHandler());
        } catch (Exception e) {
            throw new RuntimeException(e);
        }
        return messages;
    }
   }

我试过

  

元素项= root.getChild(“RDF_NAMESPACE”,ITEM);   元素项= root.getChild(“”,ITEM);   元素项= root.getChild(ITEM);

但是这3个选项会返回0条消息。 任何帮助将非常感激。非常感谢提前。

1 个答案:

答案 0 :(得分:1)

我无法解决您的具体问题,但我的一般建议是:不要这样做 - 不要尝试将RDF解析为XML。

特定的RDF语法RDF / XML确实是语法上的XML,但它是将图模型(RDF)塞进树模型(XML)然后将其序列化的结果。解析RDF / XML有各种各样的选择和边缘情况,并且是一般的噩梦;它会让你撕掉你的头发。

看起来你是用Java做的。 MRG是一个优秀,轻量级的Java RDF解析器,我过去曾成功使用它。

已编辑:以前似乎已经提出了类似的问题(专门询问RSS工具而不是XML工具)。见How to write an RSS feed with Java?。如果您可能解析的唯一RDF是RSS,那么这看起来是一个不错的选择,但我会评估两者,如果我是你,只是为了更全面地了解可能性。

另外,单独地,您的示例中似乎有两个rdf:RDF元素。这是一个剪切和粘贴错误,还是你正在处理严重格式错误的RDF?