Question

可能重复：
  Regex to match URL
  regex to remove the webpage part of a url in ruby

我正在寻找一个正则表达式来解析文件中的所有网址我尝试了谷歌搜索后获得的许多正则表达式，但在一个或另一个案例中失败了。我的想法是编写一个在begening检查http或https的存在的一个，它将匹配所有内容，直到它看到一个空格。
任何想法？
注意：我不需要解析网址但删除文件中的所有网址或至少使其无法读取。

Answer 1

标准URI库提供URI.regexp，它是url string的正则表达式。

 require 'uri'
 string.scan(URI.regexp)

http://ruby-doc.org/stdlib/libdoc/uri/rdoc/index.html

Answer 2

你可以试试这个：

/https?:\/\/[\S]+/

\S表示任何非空白字符。

(Rubular)

Ruby正则表达式匹配url

2 个答案: