<blockquote>&amp;之间匹配单词的正则表达式</BLOCKQUOTE>

时间:2010-04-19 07:38:45

标签: ruby regex

基本上我想在blockquotes之间删除单词文档。我是一个正则表达式newb甚至在使用rubular后,我也没有接近答案了。

感谢任何帮助。

3 个答案:

答案 0 :(得分:10)

使用HTML解析器并忘记正则表达式。正则表达式无法正确处理HTML。

doc = Nokogiri::HTML(your_html)
doc.xpath("//blockquote").remove

来自:Strip text from HTML document using Ruby

如果你环顾四周,还有更多关于如何使用Nokogiri和XPath的例子。

答案 1 :(得分:0)

原始示例:

/<blockquote>([^<]*)<\/blockquote>/

答案 2 :(得分:0)

示例字符串:

&lt; blockquote&gt; Hello world&lt; / blockquote&gt;

在rubular中键入以下正则表达式 &LT; BLOCKQUOTE&GT;&LT(+。); / BLOCKQUOTE&GT;

或更通用的东西:

&LT。* GT;?(?+)&LT; /.*&GT;

希望它有所帮助!

相关问题