使用Jsoup从XML标记获取图像URL

时间:2015-11-18 23:07:59

标签: java xml jsoup

我试图在XML文件中获取图片网址,但我不能!

其他标签,如"描述,标题等"成功了! XML文件:

db2_fetch_object()

我的代码:

2015-11-18 10:43:53pm : stmt = Resource id #21
2015-11-18 10:43:53pm : exec = 1
2015-11-18 10:54:27pm : db2_stmt_errormsg = 

1 个答案:

答案 0 :(得分:1)

您可以看到here,如果JSoup将其解析为HTML文件,则您的IMAGE标记正在修改并变为<img>

以下是如何正确解析XML文件:

Document doc = Jsoup.parse(yourXMLstring,"",Parser.xmlParser());

修改

它确实像这样工作:

public static void main(String[] args) {
    String xml = "<DOC><DOCNO>annotations/01/1001.eng</DOCNO><TITLE>Godchild Gustavo Javier Cuchiparte Umaginga</TITLE><DESCRIPTION>a dark-skinned boy wearing a black cap;</DESCRIPTION><NOTES></NOTES><LOCATION>Quilotoa,Ecuador</LOCATION><DATE>April 2002</DATE><IMAGE>images/01/1001.jpg</IMAGE><THUMBNAIL>thumbnails/01/1001.jpg</THUMBNAIL></DOC>";
    Document doc = Jsoup.parse(xml,"",Parser.xmlParser());
    String image = doc.select("IMAGE").first().text();
    String image2 = doc.getElementsByTag("IMAGE").get(0).text();
    System.out.println(image);
    System.out.println(image2);
}

输出

images/01/1001.jpg
images/01/1001.jpg

如果它不适合你,你当然还有另一个问题。它不在您的代码中。