如何从java中的相对url获取绝对url

时间:2013-03-05 18:05:44

标签: url web-crawler relative-url

我有一个类似mypage.com/a/b/somePage.html的页面,其中一个锚点href属性类似于“a / b / anotherPage.html”。

当我尝试通过创建具有页面网址和href值的新网址对象来获取绝对网址时,我获取绝对网址为mypage.com/a/b/a/b/anotherPage.html.

这给我带来了问题,但有些浏览器正确处理这个问题。

可用于解决此问题的任何开箱即用的东西。 (我总是可以在代码中添加一个异常来处理这个问题,但我不想这样做。)

1 个答案:

答案 0 :(得分:3)

使用java.net.URL

URL baseUrl = new URL("http:www.google.com/someFolder/");
URL url = new URL( baseURL , "../test.html");