正则表达式匹配字符串开始和特定单词之间

时间:2018-04-11 10:59:59

标签: regex

我有这个字符串:

<a href="/article/aujourd-hui-moment-calin-avec-mon-copain-attache-et-a-4-pattes-il-finis-en-moi-et-recoit-u_267211.html"> Aujourd&#x2019;hui, moment &#xE0; la fois c&#xE2;lin et torride avec mon copain. On se fait un petit d&#xE9;lire BDSM et, me retrouvant &#xE0; 4 pattes, il m&apos;attache. Apr&#xE8;s cette session o&#xF9; on en a fini, il re&#xE7;oit un appel urgent et part. En me laissant comme &#xE7;a. VDM </a>

我想得到这个:

Aujourd&#x2019;hui, moment &#xE0; la fois c&#xE2;lin et torride avec mon copain. On se fait un petit d&#xE9;lire BDSM et, me retrouvant &#xE0; 4 pattes, il m&apos;attache. Apr&#xE8;s cette session o&#xF9; on en a fini, il re&#xE7;oit un appel urgent et part. En me laissant comme &#xE7;a. VDM

我已经进行了研究并成功使用了这个正则表达式

  

[^&GT;] +(= \&LT;?)

问题是我有其他类似的字符串:

<a href="/aleatoire">Al&#xE9;atoire <span class="rub_icon icon-dice"></span></a>

使用此字符串和正则表达式我得到Al&#xE9;atoire不好

所以我想将正则表达式改进为仅获取 BEGINS Aujourd&#x2019;hui的整个句子 有人可以有解决方案吗?我不习惯正则表达式。

2 个答案:

答案 0 :(得分:0)

所以,基于你的解释:

>\s?(Aujourd&#x2019;hui.*?)\s?<

>< specifies that content is between brackets (outside of html)

\s? specifies that there may be, but doesnt have to be whitespace

没有:

 <a>string</a>

使用:

 <a>
   string
 </a>

 Aujourd&#x2019;hui specifies match has to start with this word

 .*? specifies optional additional characters in string

我希望订单很明显。

  

编辑:为了避免混淆,我们正在讨论_match函数   完整正则表达式为/>\s?(Aujourd&#x2019;hui.*?)\s?</g

     

https://regex101.com/r/F0bPWN/2

答案 1 :(得分:0)

在Sed中,要仅打印不以标记开头的行,您可以使用:

sed -n '/^[^<].*$/p' fr.html 
Aujourd&#x2019;hui, moment &#xE0; la fois c&#xE2;lin et torride avec mon copain. On se fait un petit d&#xE9;lire BDSM et, me retrouvant &#xE0; 4 pattes, il m&apos;attache. Apr&#xE8;s cette session o&#xF9; on en a fini, il re&#xE7;oit un appel urgent et part. En me laissant comme &#xE7;a. VDM

或者你可以做两次相反的事情,删除以标签开头的行:

sed  '/^<.*$/d' fr.html 
Aujourd&#x2019;hui, moment &#xE0; la fois c&#xE2;lin et torride avec mon copain. On se fait un petit d&#xE9;lire BDSM et, me retrouvant &#xE0; 4 pattes, il m&apos;attache. Apr&#xE8;s cette session o&#xF9; on en a fini, il re&#xE7;oit un appel urgent et part. En me laissant comme &#xE7;a. VDM