使用Javascript从URL解析XML / RSS

时间:2011-11-23 06:00:50

标签: javascript xml-parsing

您好我想使用纯Java脚本(而不是jquery)从像http://rss.news.yahoo.com/rss/entertainment这样的实时网址解析xml / rss。我google了很多。没有什么对我有用。任何人都可以帮助处理一段代码。

3 个答案:

答案 0 :(得分:37)

(你不能用Google搜索。)一旦你有worked around the Same Origin Policy,并且资源是XML MIME typeit is in this casetext/xml),可以做到以下几点:

var x = new XMLHttpRequest();
x.open("GET", "http://feed.example/", true);
x.onreadystatechange = function () {
  if (x.readyState == 4 && x.status == 200)
  {
    var doc = x.responseXML;
    // …
  }
};
x.send(null);

(另请参阅AJAX,以及XMLHttpRequest Level 2规范[Working Draft]了解其他事件处理程序属性。)

实质上:无需解析。如果您想访问XML数据,请使用标准DOM Level 2+ CoreDOM Level 3 XPath方法,例如

/* DOM Level 2 Core */
var title = doc.getElementsByTagName("channel")[0].getElementsByTagName("title")[0].firstChild.nodeValue;

/* DOM Level 3 Core */
var title = doc.getElementsByTagName("channel")[0].getElementsByTagName("title")[0].textContent;

/* DOM Level 3 XPath (not using namespaces) */
var title = doc.evaluate('//channel/title/text()', doc, null, 0, null).iterateNext();

/* DOM Level 3 XPath (using namespaces) */
var namespaceResolver = (function () {
  var prefixMap = {
    media: "http://search.yahoo.com/mrss/",
    ynews: "http://news.yahoo.com/rss/"
  };

  return function (prefix) {
    return prefixMap[prefix] || null;
  };
}());

var url = doc.evaluate('//media:content/@url', doc, namespaceResolver, 0, null).iterateNext();

(另请参阅JSX:xpath.js以获取不使用jQuery的方便的,名称空间感知的DOM 3 XPath包装器。)

但是,如果出于某些(错误的)原因,MIME类型不是XML MIME类型,或者DOM实现无法识别它,则可以使用最近浏览器中内置的解析器之一来解析{ {1}}属性值。有关在IE / MSXML中有效的解决方案,请参阅pradeek's answer。以下内容适用于其他任何地方:

responseText

按上述步骤继续。

在运行时使用功能测试来确定给定实现的正确代码分支。最简单的方法是:

var parser = new DOMParser();
var doc = parser.parseFromString(x.responseText, "text/xml");

另请参阅DOMParserHTML5: DOM Parsing and Serialization (Working Draft)

答案 1 :(得分:11)

您可能遇到的一个大问题是,通常情况下,您无法获取跨域数据。对于大多数rss feed来说,这是一个大问题。

处理在javascript跨域中加载数据的常用方法是调用JSONP。基本上,这意味着您要检索的数据包含在javascript回调函数中。您使用脚本标记加载URL,然后在代码中定义该函数。因此,当脚本加载时,它会执行该函数并将数据作为参数传递给它。

大多数xml / rss提要的问题是只提供xml的服务往往不提供JSONP包装功能。

在继续前行之前,请检查您的数据源是否提供json格式和JSONP功能。这将使这更容易。

现在,如果您的数据源提供json和jsonp功能,那么您必须具有创造性。

相对简单的处理方法是使用代理服务器。您的代理在您控制的某个地方运行,并充当中间人以获取您的数据。服务器加载你的xml,然后你的javascript代替它做请求。如果代理服务器运行在相同的域名上,那么您可以使用标准的xhr(ajax)请求,而不必担心跨域的问题。

或者,您的代理服务器可以将数据包装在jsonp回调中,您可以使用上面提到的方法。

如果您使用的是jQuery,那么xhr和jsonp请求是内置方法,因此非常容易编写代码。其他常见的js库也应该支持这些。如果你是从头开始编写所有这些,那么它的工作要多一些,但并不是非常困难。

现在,一旦你得到你的数据,希望它只是json。然后就不需要解析了。

但是,如果你最终不得不坚持使用xml / rss版本,并且如果你是jQuery,你可以简单地使用jQuery.parseXML http://api.jquery.com/jQuery.parseXML/

答案 2 :(得分:-1)

更好地将xml转换为json。 http://jsontoxml.utilities-online.info/

转换后如果需要打印json对象请查看本教程 http://www.w3schools.com/json/json_eval.asp