使用python从doc文件中提取文本

时间:2017-12-07 08:45:49

标签: python python-3.x docx

import doc2txt

我想用Doc2txt从文档文件中提取字符串,它会出现以下错误。

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/local/lib/python3.5/dist-packages/doc2text/__init__.py", line 7, in <module>
    import PythonMagick
ImportError: No module named 'PythonMagick'

2 个答案:

答案 0 :(得分:0)

如果pip给你带来问题,你可以手动安装whl包。

包裹:

https://www.lfd.uci.edu/~gohlke/pythonlibs/#pythonmagick

选择您要安装的版本

用法:

pip install <whl file>

答案 1 :(得分:0)

首先打开一个终端,然后:

sudo apt-get install python-magic

pip3 install --user python-magic

它会安装你需要的东西。

你可以看看here看看如何使用python-magic

此致