Jsoup(connect)Java需要很长时间

时间:2011-07-14 16:26:01

标签: java html parsing jsoup

我正在尝试从许多html页面中获取几行代码。

我正在使用Jsoup,超过70多个html页面花费超过2分钟(90%的时间用于通过jsoup.connect创建新文档)。

这是正常的吗?使用另一个解析器会有什么不同吗?

Document doc = Jsoup.connect(Url).timeout(10*1000).get();

我能够浏览所有网页。

1 个答案:

答案 0 :(得分:0)

jsoup通常需要大约2秒钟才能建立连接并获取html内容

如果该网址被重定向到另一个站点,则可能最多需要5秒钟。

可能会将您获取的某些页面重定向,将超时设置为3秒,您可能知道出了什么问题..