我正在使用代理并将AUTO_AUTOTHROTTLE_ENABLED设置为True。我的印象是,scrapy会限制我正在抓取的网站,而不是scrapy限制请求代理自己。如何限制对站点的请求而不是代理?
更新:我在发出每个请求时手动设置meta中的代理,而不是使用代理中间件。
答案 0 :(得分:2)
我不认为这可以完全从蜘蛛那边做。通过查看throttling algorithm和AutoThrottle extension source code,您可以看到正在使用的延迟是发送请求和获取响应之间的时差。中间发生的所有事情都会延迟到此延迟(包括代理延迟)。 要进一步验证这一点,请考虑以下步骤: