我需要使用正则表达式

时间:2018-04-15 23:25:00

标签: regex string replace notepad++ preg-replace

希望有人可以帮助我。我有一个文本文件,其中包含多行XML格式的RSS URL列表。文本文件如下所示:

<outline type="rss" text="Tech Viral" title="Tech Viral" xmlUrl="http://feeds.feedburner.com/TechViral" htmlUrl="https://techviral.net"/>
<outline type="rss" text="The Verge" title="The Verge" xmlUrl="http://www.theverge.com/rss/full.xml" htmlUrl="https://www.theverge.com/"/>
<outline type="rss" text="Joystiq" title="Joystiq" xmlUrl="http://www.joystiq.com/rss.xml" htmlUrl="https://www.engadget.com/rss.xml"/>
<outline type="rss" text="BGR" title="BGR" xmlUrl="http://www.boygeniusreport.com/feed/" htmlUrl="http://bgr.com"/>

我想摆脱以前的一切:

xmlUrl="

以及之后的一切:

"

所以最终输出看起来像这样:

http://feeds.feedburner.com/TechViral
http://www.theverge.com/rss/full.xml
http://www.joystiq.com/rss.xml
http://www.boygeniusreport.com/feed/

基本上,我只想让文件中的供稿网址留在一行。任何人都可以帮忙吗?我在Windows上使用Notepad ++,但如果有另一个软件比正则表达式更容易,我会采取任何建议来完成工作。

谢谢大家!

2 个答案:

答案 0 :(得分:2)

不需要花哨

查找(?m)^.*xmlUrl="([^"]*)".*
替换$1

答案 1 :(得分:1)

使用look behid(?<=):

(?<=xmlUrl=")[^"]+

将匹配xmlUrl="之后的任何内容,直到下一个引用"