urllib2不下载pdf文件

时间:2013-03-18 08:42:42

标签: python pdf download urllib2

我使用以下代码下载我的文件:

def downloadfile(url): #function to download file    
    file_name = filename_parse(url)
    #print "***********************"
    #print "File download started:"
    #stime= time.time()
    u = urllib2.urlopen(url)
    f = open(file_name, 'wb')
    getfilesize(u)
    file_size = getfilesize(u)
    print "Downloading: %s Bytes: %s \n" % (file_name, file_size)
    file_size_dl = 0
    block_sz = 512
    progressbar(u,block_sz,file_size_dl,f,file_size)
f.close()

问题是它可以下载任何文件exe,txt和其他文件,除了.pdf文件......我怎样才能下载pdf文件?

1 个答案:

答案 0 :(得分:0)

我知道这是一个古老的问题,但是对于那些偶然发现并且使用python 2和urllib2下载pdf文件的人来说,这里是代码:

import urllib2
url = 'http://mensenhandel.nl/files/pdftest2.pdf'
print "Download started..."
f = urllib2.urlopen(url)
data = f.read()
with open("test.pdf", "wb") as code:
    code.write(data)
print "Download completed..."

只需根据需要修改网址即可...

来源:http://www.blog.pythonlibrary.org/2012/06/07/python-101-how-to-download-a-file/