在模块re中使用findall函数用于python

时间:2016-05-12 06:34:47

标签: python function findall

我写了这样的代码:

>>> import re
>>> url='<a href="C:\python34\koala.jpg">jpg</a><font size="10">'
>>> print(re.findall('href="(.*?)"><',url))

我除了结果

C:\python34\koala.jpg">jpg</a 

但我只能看到这个结果:

[]

为什么会这样?

我不知道为什么我在控制台中有这个结果 请帮帮我 我使用的是python 3.4和windows8.1。

1 个答案:

答案 0 :(得分:2)

您确定也想要>jpg</a部分。如果是,那么你可以使用它:

>>> re.findall('href="([^"]*">[^<]*</a)',url)
['C:\\python34\\koala.jpg">jpg</a']

如果您只需要href属性值,则可以使用:

>>> re.findall('href="([^"]*")',url)
['C:\\python34\\koala.jpg"']