HTTP错误提取网址

时间:2017-06-03 23:04:31

标签: java jsoup

我试图用Jsoup解析这个网站:http://www.listofnewspapers.com/2014/04/site-map.html但是我收到了这个错误:

  

对于' http://www.listofnewspapers.com/2014/04/site-map.html':HTTP错误提取网址"

我认为错误发生在connect(URL).get()

我打印了状态代码以进行调试,我得到了200

我尝试了多个其他网站,他们连接得很好。

2 个答案:

答案 0 :(得分:1)

似乎过滤了用户代理。尝试设置一个:

Jsoup.connect(URL).userAgent("Mozilla").get()

答案 1 :(得分:0)

使用Firefox userAgent:

.userAgent("Mozilla")

例如:

Jsoup.connect("https://stackoverflow.com/questions/44349297/http-error-fetching-url").userAgent("Mozilla").get();

来源:Can Jsoup simulate a button press?