从Nokogiri结果中删除多余的空格和\ n

时间:2015-04-15 18:49:04

标签: ruby-on-rails ruby nokogiri

使用Nokogiri::HTML(existing_html)解析现有HTML,并在对其执行某些操作后,Nokogiri返回此输出:

<!DOCTYPE html>
<html>
   <body>
      <p>["\n", "\n", "   </p>
      \n", "      
      <meta http-equiv='\"Content-Type\"' content='\"text/html;' charset='UTF-8\"'>
      \n", "      
      <title>My Html</title>
      \n", "   \n", "   \n", "      
      <div valign='\"top\"'>
      \n", "         
      <div class='\"myclass\"'>
         \n", "            
         <div class='\"content\"' style='\"white-space:' pre-wrap>\n", "               <img src="%5C%22MyImageSource%5C%22">\n", "           </div>
         \n", "      
      </div>
      \n", "   \n", ""]
   </body>
</html>

我希望删除多余的空格和'\ n'字符。所以假设它存储在result变量中,我尝试了result.to_s.gsub(/\n/, '')result.to_s.gsub(/\n/, '').strip,但我得到了同样的东西。

如何删除额外空格和“\ n”?另外我很想知道它为什么会被添加?

如果需要任何代码来告诉我如何获得结果,请告诉我。

0 个答案:

没有答案