读取eml文件的最快方法

时间:2020-05-28 15:13:27

标签: python file email parsing eml

我必须处理数十万个eml文件。通过进行一些时间测试,似乎可以很好地确定时间的部分是对eml文件的实际读取。它们是不同类型的Emls,例如,有些是电子邮件,有些是IM,等等。

电子邮件使用时间最长。到目前为止,这是我一直在做的事情:

import email
from email.parser import Parser

#Emails
message = email.message_from_file(open(file, encoding = 'utf-8')
messages = [part.get_payload() for part in message.walk() if part.get_content_type() == 'text/plain']

#IMs
if message.is_multipart():
    chat = str(parser.parsestr(str(message)).get_payload(0))
else:
    chat = str(parser.parsestr(str(message)).get_payload()

每行只有几行,但我只是想知道是否有更快/更快的方式来解析/读取Python中的emls(并获得主体)。

0 个答案:

没有答案
相关问题