使用JSOUP从另一个网站获取数据

时间:2018-10-25 04:22:19

标签: java jsoup

基本上,我需要一张包含所有可能存在的书的桌子,而我不想这样做,因为我是一个非常懒惰的人xD。所以,我的问题是..我可以使用一个我想过的网站,就像切断该网站的其余部分(不需要的)并只保留搜索部分一样(可以在其中进行某些更改)版式...),然后进行搜索,查找书籍并将仅对我有意义的数据存储在我的数据库中。那可能吗?我听说JSOUP可以提供帮助。 所以,我只想要一些技巧。 (阅读时要谢谢)。

网站:http://www.isbn.bn.br/website/consulta/cadastro

1 个答案:

答案 0 :(得分:1)

是的,您可以使用Jsoup做到这一点,主要问题是共享的URL使用JavaScript,因此您需要使用Selenium强制执行JS,或者还可以获取书的URL并对其进行解析。

使用Jsoup解析Web的方法是:

Document document = Jsoup.connect("YOUR-URL-GOES-HERE")
                         .userAgent("Mozilla/5.0")
                         .get();

您将在文档中检索整个HTML,因此可以使用CSS选择器获取Element中包含的任何元素,例如,如果要在HTML中检索网络标题,则可以使用:

Elements elements = document.select("title");

,对于您要从中检索信息的每个HTML标签。您可以检查Jsoup Doc并检查一些解释的示例:Jsoup

希望对您有所帮助!