基于正则表达式的匹配器

时间:2012-01-12 12:06:46

标签: java regex

String inputs ="td class=\"prodcatnamelinkwrap\"";
Pattern p = Pattern.compile("<td cellspacing=\"0\" align=\"center\" valign=\"bottom\" class=\"prodcatimagewrap\">");
Matcher m = p.matcher(inputs);

我应该怎么做才能匹配这种格式。 任何人帮助我 提前致谢

find方法如何工作。 我必须在本文

中匹配td height =“45px”valign =“top”

td align =“center”height =“45px”valign =“top”&gt;。

但它一直都是假的

For reference please find my code


Pattern replace5 = Pattern.compile(".*\r?\n",Pattern.MULTILINE);

Matcher matcher5 = replace5.matcher("td[@height=\"45px\"][@valign=\"top\"]".replaceAll("[\\[\\@]+"," "));
                                                    pattern3 = Pattern.compile(matcher5.replaceAll(" ").replaceAll("\\//", "").replaceAll("\\]",""));

pm3 = pattern3.matcher("<td align="center" height="45px" valign="top">");

if(pm3.find())

....It always results in false.Can anyone help me out

1 个答案:

答案 0 :(得分:1)

不要重新发明轮子。使用像jsoup这样的html解析器。

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Elements newsHeadlines = doc.select("#mp-itn b a");