python正则表达式中的整个单词

时间:2014-08-18 05:58:51

标签: python regex

如何在Python中使用正则表达式查找整个单词? 我使用Beautiful soup和re library来解析文档。在汤中,我需要在“电子邮件”字样后找到所有内容。我试试

for sublink in link.findAll(text = re.compile("[E-mail:0-9a-zA-Z]")):
         print sublink.encode('utf-8') 

但它不起作用。

1 个答案:

答案 0 :(得分:1)

以下是通过正则表达式提取单词的工作示例:

import re

text = "First line\n" + \
    "Second line\n" + \
    "Important line! E-mail:mail@domain.de, Phone:991\n" + \
    "Another important line! E-mail:tom@gmail.com, Phone:001\n" + \
    "Another line"
print text

emails = re.findall("E-mail:([\w@.-]+)", text)
print "Found email(s): " + ', '.join(emails)

输出:

Found email(s): mail@domain.de, tom@gmail.com

不确定这是否是您要找的。

修改:字符0-9a-zA-Z可以写为\w。是的,我添加了.-。如果有更多可能的字符,只需将它们放入[\w@.-]