用于提取src

时间:2018-01-22 09:22:07

标签: regex

我想在src之后拉出字符串,如以下两个样本:

  1. 图片/ 17/0000894189 / 0000894189-17-005831 / image00003.jpg
  2. 图片/ 17/0000894189 / 0000894189-17-005831 / image0.jpg
  3. <div style="TEXT-ALIGN: center"><img src="Images/17/0000894189/0000894189-17-005831/image00003.jpg"></div>
    
    <div style="TEXT-ALIGN: justify"><iMg style="HEIGHT: 63px; WIDTH: 289px" src="Images/17/0000894189/0000894189-17-005831/image0.jpg"></div>
    

    你能建议正则表达式给我这个价值吗? img标记中src属性的位置可能会有所不同。

1 个答案:

答案 0 :(得分:0)

这取决于您使用正则表达式的位置,但有点像

.*src="(\([^"]*\)".*

应该为您提供sed中寻找的路径,例如

sed -n '/img src/s#src="(\([^"]*\)"#\1#gp' inputfile