JSOUP - 帮助从<div class =“”> </div>获取<img src=""/>

时间:2015-02-18 11:07:52

标签: java html jsoup

我有下面的HTML代码段。有多个div类用于&#34; teaser-img&#34;整个文件。我希望能够抓住所有的&#34; img src&#34;来自所有这些&#34; teaser-img&#34;类。

<div class="teaser-img">
    <a href="/julien/blog/failure-consciousness-vs-success-consciousness-shifting-focus-become-badass-or-loser">
        <img src="http://www.rsdnation.com/files/imagecache/blog_thumbnail/files/blog_thumbs/rsdnatonaustin.jpg" alt="" title=""/>
    </a>
</div>

我尝试了很多东西,所以我不知道与你们分享的代码。非常感谢您的帮助。

1 个答案:

答案 0 :(得分:0)

final String html = "<div class=\"teaser-img\">\n"
        + "    <a href=\"/julien/blog/failure-consciousness-vs-success-consciousness-shifting-focus-become-badass-or-loser\">\n"
        + "        <img src=\"http://www.rsdnation.com/files/imagecache/blog_thumbnail/files/blog_thumbs/rsdnatonaustin.jpg\" alt=\"\" title=\"\"/>\n"
        + "    </a>\n"
        + "</div>";

// Parse the html from string or eg. connect to a website using connect()
Document doc = Jsoup.parseBodyFragment(html);

for( Element element : doc.select("div.teaser-img img[src]") )
{
    System.out.println(element);
}

<强>输出:

<img src="http://www.rsdnation.com/files/imagecache/blog_thumbnail/files/blog_thumbs/rsdnatonaustin.jpg" alt="" title="">

有关选择器语法的文档,请参阅here

相关问题