提取"作者"来自亚马逊的一本书和Jsoup

时间:2014-08-18 07:30:58

标签: html jsoup extract

我现在正在尝试这几天,它不会萎缩。 我想要这本书作者的名字 “http://www.amazon.de/Weit-weg-ganz-Jojo-Moyes-ebook/dp/B00H07CB9O/ref=sr_1_1?s=books&ie=UTF8&qid=undefined&sr=1-1”。

正如firebug所示,它位于以下代码中。

<html>
...
<div class="buying">
    <h1 class="parseasinTitle">
    <span>
       <span class="contributorNameTrigger" asin="B001HMNFPMB00H07CB9O">
       <a id="contributorNameTriggerB001HMNFPMB00H07CB9O" href="http://www.amazon.de/Jojo-Moyes/e   /B001HMNFPM/ref=ntt_athr_dp_pel_1" asin="B001HMNFPMB00H07CB9O">Jojo Moyes</a>
    <a href="#" asin="B001HMNFPMB00H07CB9O">
    </span>
...
</html>

我尝试用

选择名称
doc.getElementsByClass("contributorNameTrigger")

但它不起作用。然后我使用了“购买”类并试图选择跨度和跨度类但它既不起作用

doc.getElementsByClass("buying").select("span").select("span[class=contributorNameTrigger");

感谢任何帮助!

1 个答案:

答案 0 :(得分:0)

它最终使用以下代码:

Element author = doc.getElementsByClass("buying").select("span").select("a").first();

Thanx的答案!