这个脚本有什么问题?我收到HTTP错误

时间:2018-11-02 13:38:17

标签: python html

有人可以告诉我为什么此脚本无法正常工作,为什么我会收到HTTP错误:

import sys
import bs4
import requests
import webbrowser
def search(productUrl):
    headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.10; rv:39.0)'}
    res=requests.get(productUrl,headers=headers)
    res.raise_for_status()
    soup=bs4.BeautifulSoup(res.text,"html.parser")
    linkedelement=soup.select('.r a')
    linkstoopen=min(5,len(linkedelement))
    for i in range(linkstoopen):
        webbrowser.open('https://google.co.in'+linkedelement[i].get('herf'))
sea=search('https://google.co.in/search?q='+''.join(sys.argv[1:]))

1 个答案:

答案 0 :(得分:0)

尝试通过代理运行它。确保编辑IP和端口。

代码如下:

import sys
import bs4
import requests
import webbrowser

def search(productUrl):
    http = "https://IP:PORT"
    https = "http://IP:PORT"

    proxy = { 
        "http"  : http, 
        "https" : https, 
    }

    headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.10; rv:39.0)'}
    res=requests.get(productUrl, headers=headers, proxies=proxy)
    res.raise_for_status()
    soup=bs4.BeautifulSoup(res.text,"html.parser")
    linkedelement=soup.select('.r a')
    linkstoopen=min(5,len(linkedelement))
    for i in range(linkstoopen):
        webbrowser.open('https://google.co.in'+linkedelement[i].get('herf'))

sea=search('https://google.co.in/search?q='+''.join(sys.argv[1:]))