Java -Android。解析器问题

时间:2011-09-16 07:40:00

标签: java android xml xml-parsing simple-framework

我正在使用RSS阅读器制作一个非常简单的应用程序。读者工作得很好,但它只给我标题,我也想要描述。 我是一个非常新的android,我尝试了很多东西,但我无法让它工作。 我找到了很多解析器,但它们让我很难理解,所以我希望找到一个简单的解决方案,因为它只是我想要的标题和描述。 谁能帮我?

import java.io.IOException;
import java.net.MalformedURLException;
import java.net.URL;

import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.Attributes;
import org.xml.sax.InputSource;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.DefaultHandler;

import android.app.Activity;
import android.os.Bundle;
import android.widget.TextView;

public class NyhedActivity extends Activity {
    String streamTitle = "";
    @Override
    protected void onCreate(Bundle savedInstanceState) {
        // TODO Auto-generated method stub
        super.onCreate(savedInstanceState);
        setContentView(R.layout.nyheder);

        TextView result = (TextView)findViewById(R.id.result);

           try {
       URL rssUrl = new URL("http://tv2sport.dk/rss/*/*/*/248/*/*");
       SAXParserFactory mySAXParserFactory = SAXParserFactory.newInstance();
       SAXParser mySAXParser = mySAXParserFactory.newSAXParser();
       XMLReader myXMLReader = mySAXParser.getXMLReader();
       RSSHandler myRSSHandler = new RSSHandler();
       myXMLReader.setContentHandler(myRSSHandler);
       InputSource myInputSource = new InputSource(rssUrl.openStream());
       myXMLReader.parse(myInputSource);

       result.setText(streamTitle);

      } catch (MalformedURLException e) {
       // TODO Auto-generated catch block
       e.printStackTrace();
       result.setText("Cannot connect RSS!");
      } catch (ParserConfigurationException e) {
       // TODO Auto-generated catch block
       e.printStackTrace();
       result.setText("Cannot connect RSS!");
      } catch (SAXException e) {
       // TODO Auto-generated catch block
       e.printStackTrace();
       result.setText("Cannot connect RSS!");
      } catch (IOException e) {
       // TODO Auto-generated catch block
       e.printStackTrace();
       result.setText("Cannot connect RSS!");
      }


       }

       private class RSSHandler extends DefaultHandler
       {
        final int stateUnknown = 0;
        final int stateTitle = 1;
        int state = stateUnknown;

        int numberOfTitle = 0;
        String strTitle = "";
        String strElement = "";

      @Override
      public void startDocument() throws SAXException {
       // TODO Auto-generated method stub
       strTitle = "Nyheder fra ";
      }

      @Override
      public void endDocument() throws SAXException {
       // TODO Auto-generated method stub
       strTitle += "";
       streamTitle = "" + strTitle;
      }

      @Override
      public void startElement(String uri, String localName, String qName,
        Attributes attributes) throws SAXException {
       // TODO Auto-generated method stub
       if (localName.equalsIgnoreCase("title"))
       {
        state = stateTitle;
        strElement = "";
        numberOfTitle++;
       }
       else
       {
        state = stateUnknown;
       }
      }

      @Override
      public void endElement(String uri, String localName, String qName)
        throws SAXException {
       // TODO Auto-generated method stub
       if (localName.equalsIgnoreCase("title"))
       {
        strTitle += strElement + "\n"+"\n";
       }
       state = stateUnknown;
      }

      @Override
      public void characters(char[] ch, int start, int length)
        throws SAXException {
       // TODO Auto-generated method stub
       String strCharacters = new String(ch, start, length);
       if (state == stateTitle)
       {
        strElement += strCharacters;
       }
      }
    }

}

3 个答案:

答案 0 :(得分:1)

在Java中解析XML时,我从未真正使用过SAX。我总是使用JDOM。它简单易用。

要使用JDOM读取XML文件,您需要创建一个文档并使用InputStream和SAXBuilder填充它:

SAXBuilder builder = new SAXBuilder();
Document document = builder.builder( myInputStream );

在您发布的案例中:myInputStream = url.openStream();

然后你需要获取XML文档的根目录:

Element root = document.getRootElement();

现在很简单。由于我不知道你得到的XML的结构,我只是假设它看起来像:

<rssfeed>
  <news>
    <title> Title </title>
    <description> Description </description>
  </news>
  <news>
    <title> ... </title>
    <description> ... </description>
  </news>
  <news>
    <title> ... </title>
    <description> ... </description>
  </news>
<rssfeed>

然后,您可以列出所有这样的元素:

List<Element> news = root.getChildren( "news" );

然后你在for-each循环中遍历列表,获取标题和描述(拥有一个数据类来保存这些信息将是一个帮助,例如一个新闻类):

ArrayList<News> newsList = new ArrayList<News>();
for( Element child : news ) {
  News news = new News();
  news.setTitle( child.getChildText( "title" );
  news.setDescription( child.getChildText( "description" );
  newsList.add( news );
}

现在你有一个可以玩的新闻列表。

答案 1 :(得分:1)

卡诺,

您可以利用top-notch performance编写此RSS提要解析器(免责声明:我是作者)来简化您的生活并获得SJXP

SJXP是一个very-very thin abstraction layer,它位于XML Pull Parsing API之上(Android提供了它自己,所以你只有sjxp.JAR依赖,每个其他平台都有XPP3),并允许你使用XPath解析用于将简单规则与文档的某些位置匹配的规则,然后告诉解析您希望从这些位置获取哪些信息。

我为你写了一个示例Eclipse项目,它会在6分钟内为你解析TV2 Sports feed(我会在底部链接它)。

主要方法如下所示,以便您了解流程:

public static void main(String[] args) throws IllegalArgumentException,
    XMLParserException, IOException {
// Location we want to parse.
URL feedURL = new URL("http://tv2sport.dk/rss/*/*/*/248/*/*");

// List we will hold all parsed stories in.
List<Item> itemList = new ArrayList<Item>();

// Get all the rules we will use to parse this file
IRule[] rules = createRules();

// Create the parser and populate it with the rules.
XMLParser<List<Item>> parser = new XMLParser<List<Item>>(rules);

// Parse the RSS feed.
parser.parse(feedURL.openStream(), itemList);

// Print the results.
System.out.println("Parsed " + itemList.size() + " RSS items.");

for (Item i : itemList)
    System.out.println("\t" + i);
}

您会看到流程从创建我们的List开始,以便在我们从doc解析它们时保留我们的项目。然后我们得到一组IRule个实例来提供解析器,然后创建解析器并为其提供在工作时使用的规则。

然后我们对feed的内容调用parse方法并将其传递给所谓的“用户对象”,更具体地说,只是我们希望它们在执行时传递给规则的任何实例。

在这种情况下,我们希望访问我们的列表,以便我们可以向它添加项目,因此我们只是将其传入,解析器在执行时将其直接传递给我们的IRule logic,以便我们可以使用它。

Item类利用只是一个简单的POJO来保存数据并使打印看起来不错:

public class Item {
    public String title;
    public String description;

    @Override
    public String toString() {
        return "Item [title='" + title + "', description='" + description + "']";
    }
}

所有有趣的东西都发生在您的IRule中,您可以在其中定义要定位的元素类型(字符数据,属性数据或仅标记打开/关闭事件),然后从IRule接口覆盖相应的方法以提供处理程序做了什么。

例如,这是解析标题的处理程序:

IRule<List<Item>> itemDescRule = new DefaultRule<List<Item>>(Type.CHARACTER, "/rss/channel/item/description") {
    @Override
    public void handleParsedCharacters(XMLParser<List<Item>> parser, String text, List<Item> userObject) {
        Item item = userObject.get(userObject.size() - 1);
        item.description = text;
    }
};

你看到你得到了解析器实例本身(所以你可以触发'stop'方法,如果你想提前结束解析),你得到的文本是字符数据,你就得到了'用户对象'碰巧是我们的名单传递给你。

我们抓住我们从列表中填充的项目,给它描述,就是这样。 2行代码。

每次遇到开放标记时,都会有另一个IRule向列表中添加一个新项目,这就是允许我们后续规则这样的规则只是将结束元素从列表中弹出并填充它。

运行项目时,输出如下所示:

Parsed 50 RSS items.
    Item [title='Barcas bøddel beæret over Barca-føler', description='Tirsdag snød Thiago Silva Barcelona for tre point, da han headede AC Milans udligning i kassen i Champions League-kampens overtid.']
    Item [title='Guardiola: Pato hurtigere end Usain Bolt', description='FC Barcelona-træner, Josep Guardiola, er dybt imponeret af Milan-målscoreren Alexandre Patos hurtighed.']
    Item [title='Milan-profil: Vi kan nå semifinalen', description='Clarence Seedorf mener, at AC Milan kan nå semifinalerne i Champions League efter 2-2 i Barcelona.']
    <SNIP...>

您可以下载我为您创建的整个Eclipse项目here

希望有所帮助。

答案 2 :(得分:0)

我希望我能帮到你:

  @Override
  public void endElement(String uri, String localName, String qName)
    throws SAXException {
   // TODO Auto-generated method stub
   if (localName.equalsIgnoreCase("title"))
   {
    strTitle += strElement + "\n"+"\n";
   }
   else if (localName.equalsIgnoreCase("lead"))
   {
    lead += strElement + "\n"+"\n";
   }
  }