JSoup Connection.userAgent被sun.net.www.protocol.http.HttpURLConnection击败

时间:2015-05-20 02:55:27

标签: java jsoup user-agent httpconnection

显然,sun.net.www.protocol.http.HttpURLConnection将始终将“Java / version”附加到UserAgent。因此,JSoup Connection.userAgent无法将useragent设置为您想要的;无论如何,“Java /版本”的内容都会被附加。

请参阅Set user-agent property in https connection header

某些网站拒绝任何地方包含“Java”的请求 用户代理,提供各种4xx和5xx HTTP错误。

上面引用的StackOverflow帖子建议使用Apache而不是Sun的HTTP连接类,但如果我想使用JSoup,这不是一个选项。

我想知道JSoup团队对此的看法。我的描述是否正确?这是一个错误还是一个功能?有没有计划修复它,即是否可以将userAgent设置为你想要的东西,而没有额外的附属物?

感谢 JWG

1 个答案:

答案 0 :(得分:0)

您可以使用Jsoup.parse(html),其中可以使用Apache HTTP或您选择的任何其他库来获取html String。 问候, Allahbaksh