我想在Word 2007文件(.docx)中搜索超链接,即如果有这么多超链接,它应该读取所有超链接,然后自动点击第一个超链接
有没有办法从Python搜索超链接并自动打开第一个超链接?
答案 0 :(得分:2)
要搜索超链接,您可以使用regexp(re
模块),例如:
re.find_all("www\..+\..{1,3}", text_data
假设text_data
包含文档中的文本。
之后,您可以使用urllib
打开您想要的页面,我会使用beautifulsoup
bs4
解析其内容