如何使用以.aspx结尾的网址从互联网上抓取图片?123

时间:2015-05-22 03:39:30

标签: python download

我熟悉使用urllib.urlretrieve从在线抓取图片(例如此处解释:https://stackoverflow.com/a/3042786/)。

我想抓取一组图片,其中网址以/get.aspx?1234结尾(带有不同的编号后缀)。我不确切知道aspx是如何工作的,但我知道当我尝试使用urllib.urlretrieve来抓取图像时它并没有起作用。我可以使用哪些其他功能?

当我在我的浏览器中以/get.aspx?1234结尾的网址时,我只会看到一个图像,显示我可以右键单击并另存为jpeg。当我在新标签页中点击打开图片时,我会得到以/get.aspx?1234结尾的完全相同的网址。我不知道用什么来更好地识别这张图片。

1 个答案:

答案 0 :(得分:0)

检查在浏览器中打开图像时发送的标题。服务器可以以某种方式检查它们以防止自动下载。 因此,基本上,当您以编程方式请求URL时,需要保留相同的标题。