HtmlUnit网页状态代码

时间:2012-06-21 16:18:42

标签: java http-status-code-404 htmlunit

我正在尝试获取给定页面的Web状态。但是当它出现404错误时,页面不会返回状态代码,而是抛出错误。

int status= webClient.getPage("website").getWebResponse().getStatusCode();
System.out.println( status);

任何想法?

我希望看到网站何时超时,但是出于测试目的,我对所需网站的网址格式不正确,看看我是否能看到404。

2 个答案:

答案 0 :(得分:13)

根据this

你可以这样做:

webclient.setThrowExceptionOnFailingStatusCode(False)

****编辑***

这会打印出您的状态代码:

 WebClient webClient = new WebClient();
 webClient.setThrowExceptionOnFailingStatusCode(false);
 int status = webClient.getPage("http://google.co.uk/ffffff").getWebResponse()
            .getStatusCode();
 System.out.println(status);

打印出404 - 您的状态代码。

答案 1 :(得分:0)

或者,您可以继续允许抛出FailingHttpStatusCodeException(true)。然后在catch子句中获取错误状态代码。

...
int status = 0;
Object page = null;
try {
     page = webClient.getPage(webRequest);
     webClient.close();
     if (page instanceof UnexpectedPage) {
         status = ((UnexpectedPage) page).getWebResponse().getStatusCode();
     } else if (page instanceof HtmlPage) {
         status = ((HtmlPage) page).getWebResponse().getStatusCode();
     }
     // do something else ...
} catch (FailingHttpStatusCodeException | IOException e) {
     if (e instanceof FailingHttpStatusCodeException) {
          status = ((FailingHttpStatusCodeException) e).getStatusCode();
     }
     // do something else ...
}