解析必须以特定字符串jsoup开头和结尾的css类名

时间:2013-05-27 07:08:11

标签: java jsoup

我刚刚开始使用jsoup,我想在jsoup中提取类似'start nav。* base'的正则表达式。然后我想得到href。在jsoup中,正则表达式不是必须使用它。那么我怎样才能获得像

这样的标签
<li class="start nav-fruit-more level-top base">
    <a class="level-top" title="All Fruits" href="url link">Fruit</a>
</li> 

1 个答案:

答案 0 :(得分:2)

您可以使用syntax [attr~=regex]选择具有与正则表达式匹配的属性值的元素。

start nav开头且以base结尾的字符串的正则表达式为^start(\s)*nav.* base$,因此您可以尝试使用:

  Document doc = Jsoup.parse(content);
  System.out.println(doc.select("[class~=^start(\\s)*nav.* base$]").first());