全面的正则表达式,用于查找HTML页面或字符串中的URL,链接,页面链接,网站链接

时间:2013-06-26 07:47:54

标签: c# asp.net regex

我已经搜索了很多关于常规的表达,但我还没有找到任何综合表达。我在互联网上发现的其中一些只是检测https或http lniks而不是其他和明智的virsa 所有这些都有任何综合表达吗?

像:

    www.google.com
https://www.fb.com
http://ww.google.com
google.com
info/contact.php
www.google.com.uk

以及更多

有没有

1 个答案:

答案 0 :(得分:0)

在这里查看http://regexlib.com/Search.aspx?k=URL&AspxAutoDetectCookieSupport=1

你可以在那里找到很多例子和模式,并且有很多一般的Regex教程和文章。

快速浏览后我发现了这个:

([\d\w-.]+?\.(a[cdefgilmnoqrstuwz]|b[abdefghijmnorstvwyz]|c[acdfghiklmnoruvxyz]|d[ejkmnoz]|e[ceghrst]|f[ijkmnor]|g[abdefghilmnpqrstuwy]|h[kmnrtu]|i[delmnoqrst]|j[emop]|k[eghimnprwyz]|l[abcikrstuvy]|m[acdghklmnopqrstuvwxyz]|n[acefgilopruz]|om|p[aefghklmnrstwy]|qa|r[eouw]|s[abcdeghijklmnortuvyz]|t[cdfghjkmnoprtvwz]|u[augkmsyz]|v[aceginu]|w[fs]|y[etu]|z[amw]|aero|arpa|biz|com|coop|edu|info|int|gov|mil|museum|name|net|org|pro)(\b|\W(?<!&|=)(?!\.\s|\.{3}).*?))(\s|$)

应该这样做,但我确信该列表上有更优雅的例子。

相关问题