httperror_seek_wrapper:HTTP错误403:robots.txt禁止请求

时间:2016-01-04 10:27:44

标签: python windows python-2.7 urllib2 mechanize-python

我在Windows上使用python 2.7 我知道已经有关于这个问题的帖子,但是我想知道如何在Windows上解决这个问题,因为在这些帖子中很少 -

Link 1

Link 2

在几个答案中的链接就是这个代码 -

hdr = {'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.64 Safari/537.11',
   'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
   'Accept-Charset': 'ISO-8859-1,utf-8;q=0.7,*;q=0.3',
   'Accept-Encoding': 'none',
   'Accept-Language': 'en-US,en;q=0.8',
   'Connection': 'keep-alive'}

这些参数是什么?我可以知道如何在Windows上执行此操作,如果有任何关于python库的好的文档/指南,请从这个错误的角度来看机械化将会有很大的帮助。

另请有人指导我这是由mechanize或urllib2引起的错误。

如果它是由机械化引起的,那么为什么urllib2会在stackoverflow上的几个帖子中引用。

我真诚地道歉,因为我不熟悉这个问题和/或可能会重新提出这个问题,因为我是这些图书馆的新手。非常感谢任何帮助!

0 个答案:

没有答案