正则表达式匹配HTML中的URL

时间:2019-01-09 23:34:37

标签: html regex bash shell sed

目前,我的命令是从HTML中以href开头的行中切出URL:

sed -ne 's/.*href="\([^"]*\).*/\1/p'

由于href可以以'"开头,而我的命令现在仅占",所以我想知道如何为两个{ {1}}和'

1 个答案:

答案 0 :(得分:4)

/^(<)(.*?)(href=)("|')(.*?)(>)$/gm

Demo

or|

()帮助您逐步将字符串分组。

这当然不是最好的,但是该在线工具可能会为您提供帮助。