链接到html页面

时间:2011-02-19 16:29:00

标签: java html

我希望能够在我的java应用程序中输入网址并查看该网页后面的html。我搞不清楚了。我该如何开始?

主要问题是如何链接到网页后面的html?

任何元信息都会有所帮助。我之前没有做任何网络内容。


谢谢你们,这是一个巨大的帮助!

3 个答案:

答案 0 :(得分:3)

如果您只对特定网址的网页来源感兴趣,可以使用URL课程和openConnection / getInputStream方法:

此示例程序打印http://www.google.com

的内容
import java.io.IOException;
import java.net.URL;
import java.util.Scanner;

public class Test {

    public static void main(String[] args) throws IOException {
        URL url = new URL("http://www.google.com");

        Scanner s = new Scanner(url.openConnection().getInputStream());
        while (s.hasNextLine())
            System.out.println(s.nextLine());
    }
}

答案 1 :(得分:2)

您所指的页面后面的html 就是。当浏览器获取页面时,它会解释它并以用户友好的方式呈现它。

以编程方式执行此操作时,无法呈现。因此页面的内容是 html。我建议使用Apache HttpClient来执行HTTP requests,或者@aioobe很好地描述URL方法。

答案 2 :(得分:2)

  

主要问题是如何链接到网页后面的html?

链接到网站或网站背后的html没有区别。它始终指向HTML源代码。

与此有何不同之处。 Web浏览器将对其进行解释和格式化,并将其作为样式网站显示给您。您仍然可以在浏览器中查看其来源。文本编辑器只会向您显示HTML标记。