使用Python(Regex)提取电子邮件的某些部分

时间:2014-06-23 23:11:36

标签: python regex

我正在尝试创建一个程序,该程序将从Outlook中的特定文件夹导入邮件,然后在电子邮件中提取某些部分。

电子邮件的格式如下: 亲爱的Mr.X,

{文字行}见下文。

客户:公司X

基金:ABCD

尺寸:

谢谢, 萨姆

我到目前为止的代码是:

import win32com.client
outlook = win32com.client.Dispatch("Outlook.Application").GetNamespace("MAPI")
inbox = outlook.GetDefaultFolder(4)
messages = inbox.Items
message = messages.GetLast()
body_content = message.body

有人可以使用正则表达式帮助我使用代码来提取"之后的电子邮件中的所有信息:"如客户:CompanyX等?

1 个答案:

答案 0 :(得分:0)

regex上的文字不仅仅需要: In [5]: s = "Client: Company X" In [6]: print s.split(":")[-1] Company X In [7]: s = "Fund: ABCD" In [8]: print s.split(":")[-1] ABCD ,而是获取最后一个元素:

{{1}}