Wget:下载特定的HTML文件

时间:2018-10-02 06:32:12

标签: wget

我一直没有成功找到答案,但是到目前为止还是空白。 Wget是否具有使用html文件的Title标记中的文本中的“关键字”下载特定html文件的功能?我以为“ --follow-tag”也许可以做到,但是Title标记未包含在Wget标记数据库中。是的,我知道我可以在下载后过滤掉文件,但不想使用该选项。 谢谢

1 个答案:

答案 0 :(得分:0)

您可以尝试以下操作:

wget -q `grep -oP '(?<=<url>).*?(?=</url>)' test.html`

它将从<url></url>文件内部搜索test.html标记内的任何url并下载。