正则表达式在一行中出现多次

时间:2015-08-24 20:54:34

标签: java regex

如何使用Java中的regex在一行中查找多个匹配项?

我的代码(包含正则表达式):

public static List<String> getTitles(String html) {
    List<String> titles = new ArrayList<String>();
    String pattern = "(.*)rel=\"bookmark\">(.*)</a></h2>";
    Pattern p = Pattern.compile(pattern);
    Matcher m = p.matcher(html);
    while (m.find())
        System.out.println(m.group(2));
    return titles;
}

我在其中使用的部分字符串:

... title="Permalink to Jet Racing Extreme &#8211; Alpha Download" rel="bookmark">Jet Racing Extreme &#8211; Alpha Download</a></h2><div class="entry-meta"> Posted on <a ...

这适用于第一次出现(实际上是整个字符串),但由于整个字符串被认为是第一次出现,所以它没有进一步查看。

我希望你能理解我想说的话,我不知道如何更清楚地解释它。

- 编辑 我也尝试用这个替换正则表达式:

rel="bookmark">(.*)</a></h2>

我认为这样做只会考虑一行字符串的一部分,从而解决我的问题。然而,仅仅采取行动:

rel="bookmark">Jet Racing Extreme &#8211; Alpha Download</a></h2>

当它出现时,它还需要它背后的一切吗?

rel="bookmark">Jet Racing Extreme &#8211; Alpha Download</a></h2><divclass="entry-meta"> Posted on <ahref="http://www.alphabetagamer.com/jet-racing-extreme-alpha-download/" title="7:29 pm" rel="bookmark"> ...

0 个答案:

没有答案