bash中的正则表达式(从正则表达式下载输出)

时间:2010-09-19 17:22:53

标签: regex bash

我有一个看起来像的文件:

<a href="some-adress">some-txt</a>
<a href="some-adress">some-txt</a>
<a href="some-adress">some-txt</a>
...

我需要下载所有“some-adress”文件,我怎样才能使用bash做到这一点?

3 个答案:

答案 0 :(得分:3)

你为什么不用wget?它已经有了这个功能:

wget -i --force-html yourfile.html

答案 1 :(得分:2)

以下是使用sedxargswget组合的一种方法:

sed -n 's/.*<a href="\([^"]*\)">.*/\1/p' input-file | xargs wget

答案 2 :(得分:0)

cut -f 2 -d '"' file-with-addresses.txt

cut包含在所有posix shell中。此命令将使用"作为分隔符拆分该行,并返回第二个“字段”。要使用wget下载Adam Rosenfield的方法很好。

cut -f 2 -d '"' file-with-addresses.txt | xargs wget