Question

我正在尝试创建一个java程序，可以从BBC网站上读取和输出橄榄球队在联赛表中的位置。

到目前为止，我已经找到并使用了这段代码，它显示了所有的HTML。

    URL oracle = new URL("http://www.bbc.co.uk/sport/football/premier-league/table");
    BufferedReader in = new BufferedReader(
    new InputStreamReader(oracle.openStream()));

    String inputLine;
    while ((inputLine = in.readLine()) != null)
        System.out.println(inputLine);
    in.close();

但我想搜索HTML以找出哪个团队处于哪个位置。例如，这是我对HTML代码

感兴趣的一点

但我不确定如何搜索它。我一直在看正则表达式，但我似乎无法找到使它运行的方法。

Answer 1

您是否查看了解析HTML的Java库？请查看jsoup或HtmlCleaner，作为this SO问题的最高投票。两者都在积极更新，最有可能满足您的需求。

与手工制作正则表达式相比，如果他们决定在将来更改标记，那么您还可以更轻松地更新代码。

如何从网站上阅读特定信息

1 个答案: