将doc和docx文件加载到python中

时间:2016-05-26 20:57:58

标签: python ms-word

我正在尝试加载大量文件,其中一半是.docx当前word文件扩展名,一半是.doc大约2007 word文件扩展名。我正在使用python docx模块打开它们获取某些值并将它们存储在数组中。我的问题是docx模块无法加载.doc文件。

我尝试使用此代码上传文件,然后将扩展名更改为.docx。

files = [f for f in os.listdir('mypath') if os.path.isfile(os.path.join('mypath', f))]
for f in range(0, len(files)):
    files[f] = os.path.splitext(files[f])[0] + '.docx'

但是当我尝试加载之前.doc

的文档时遇到此错误
PackageNotFoundError: Package not found at 'mypath\\doc.docx'

除了进入每个文件并在Microsoft Word中执行保存为.docx之外,是否有人对如何加载.doc文件有任何想法。这是不可行的,因为有很多文件。

由于

0 个答案:

没有答案
相关问题