Ruby正则表达式匹配url

时间:2011-01-17 18:30:10

标签: ruby regex url

  

可能重复:
  Regex to match URL
  regex to remove the webpage part of a url in ruby

我正在寻找一个正则表达式来解析文件中的所有网址 我尝试了谷歌搜索后获得的许多正则表达式,但在一个或另一个案例中失败了。我的想法是编写一个在begening检查http或https的存在的一个,它将匹配所有内容,直到它看到一个空格。
任何想法?
注意:我不需要解析网址但删除文件中的所有网址或至少使其无法读取。

2 个答案:

答案 0 :(得分:55)

标准URI库提供URI.regexp,它是url string的正则表达式。

 require 'uri'
 string.scan(URI.regexp)

http://ruby-doc.org/stdlib/libdoc/uri/rdoc/index.html

答案 1 :(得分:23)

你可以试试这个:

/https?:\/\/[\S]+/

\S表示任何非空白字符。

(Rubular)