我的文件是这样的:
1. first element
1.1 xxxxxxx
2. second element
2.1 yyyyyyyy
我想提取整个段落,例如第一个段落应该是(1.第一个元素+ 1.1 xxxxxx)
我使用python-docx,问题在于每一行都是一个段落,因为我总是使用相同的样式(“ Normal”)而不是“ head”。
这是我的代码:
doc = docx.Document(filename)
for para in doc.paragraphs:
print(para.text)