网址的正则表达式以匹配特定的后缀域

时间:2019-02-20 09:28:44

标签: python

它是关键字排名模块。我需要搜索后缀域名,包括co.in,co.uk
我尝试了以下代码,但无法正常运行
该代码的客户端域为:www.domain_name.com
搜索列出了clientdomain的所有网址

for j in search(s, tld="com|co.in", num=100, stop=1, pause=2):
        domain=urlsplit(j)[1].split(':')[0]
        if clientdomain == domain:
            b=c
            d=j
            h=str(now)
            o.append(b)
            m.append(d)
            flash(d)
            flash(s)
            flash(b)
            #print("The position of the google search result is:",b)
            #print("The full url:",d)
            #print("The keyword is:",s)
            #print("The date of search:",str(now))
        else:
            hasRank = False
        c=c+1
    c=0
if(hasRank == False):
        print("Uh oh, you're website is not ranked among the top 100 results. Sorry :-(")

我尝试使用正则表达式,但不起作用

   import re
   clientdomain = "www.google.com"
   print (re.search("(www.?://[^\s]+)", clientdomain))

输出       没有

1 个答案:

答案 0 :(得分:0)

我不清楚您需要什么输出,但这可能会让您入门:

print(re.findall("\.(\w+)", clientdomain))

它输出URL的除了第一部分(最可能是“ www”)之外的所有列表:

['google', 'com']
相关问题