如何搜索Restclient生成的HTML?

时间:2012-05-21 17:55:04

标签: ruby-on-rails ruby

如何在Restclient::Response模块生成的HTML中搜索单词?

$getresponse = RestClient.get (url)
html=$getadsresponse.body
puts html

我可以看到生成的HTML,但是如何在该HTML中搜索单词?

1 个答案:

答案 0 :(得分:0)

使用HTML解析器正确解释HTML。使用带有xpath的Nokogiri,例如:

doc = Nokogiri::HTML(html)
found = doc.xpath('//p[@title = "some word"]/a[contains(text(), "some word")]')
found.each do |node|
  puts node.text
end