使用正则表达式查找字符串(href)中的片段

时间:2012-10-03 18:03:09

标签: java regex

我有以下剪辑:

<a href="$click_tracking_url$&landing_url=someurl" border="0" alt=""></a>

我想要的只是someurl。但是有以下变化:

<a href='$click_tracking_url$&landing_url=someurl' border="0" alt=""></a>

<a target=blank href="$click_tracking_url$&landing_url=someurl" alt=""></a>

我有这个正则表达式,但不适用于变体:

<a href=\".*?landing_url=(.*?)\">

我该如何解决它或者是否有更简单的方法来做到这一点?

1 个答案:

答案 0 :(得分:0)

您未对所有变体进行匹配,因为您没有考虑href<a之间的属性。试试这个:

Pattern p = Pattern.compile("<a[^>]+href=[\\'\\\"].+&landing_url=(.+?)[\\'\\\"]");