如何从网站上阅读特定信息

时间:2013-12-27 15:25:00

标签: java html

我正在尝试创建一个java程序,可以从BBC网站上读取和输出橄榄球队在联赛表中的位置。

到目前为止,我已经找到并使用了这段代码,它显示了所有的HTML。

    URL oracle = new URL("http://www.bbc.co.uk/sport/football/premier-league/table");
    BufferedReader in = new BufferedReader(
    new InputStreamReader(oracle.openStream()));

    String inputLine;
    while ((inputLine = in.readLine()) != null)
        System.out.println(inputLine);
    in.close();

但我想搜索HTML以找出哪个团队处于哪个位置。例如,这是我对HTML代码

感兴趣的一点

http://gyazo.com/033b51d8513f69a47a49bff18e95218c.png

但我不确定如何搜索它。我一直在看正则表达式,但我似乎无法找到使它运行的方法。

1 个答案:

答案 0 :(得分:0)

您是否查看了解析HTML的Java库?请查看jsoupHtmlCleaner,作为this SO问题的最高投票。两者都在积极更新,最有可能满足您的需求。

与手工制作正则表达式相比,如果他们决定在将来更改标记,那么您还可以更轻松地更新代码。

相关问题