HTTPS POST请求Python

时间:2013-01-17 17:55:15

标签: python post https urllib2 urllib

我想向应该使用.csv文件回复的HTTPS站点发送帖子请求。 我有这个Python代码:

url = 'https://www.site.com/servlet/datadownload'
values = {
  'val1' : '123',
  'val2' : 'abc',
  'val3' : '1b3',
}

data = urllib.urlencode(values)
req = urllib2.Request(url,data)
response = urllib2.urlopen(req)
myfile = open('file.csv', 'wb')
shutil.copyfileobj(response.fp, myfile)
myfile.close()

但是我得到了错误:

BadStatusLine: ''    (in httplib.py)

我已尝试使用Chrome扩展程序:高级REST客户端(screenshot)进行发布请求,并且工作正常。

可能是什么问题,我该如何解决? (是因为HTTPS吗?)


编辑,重构代码:

try:
    #conn = httplib.HTTPSConnection(host="www.site.com", port=443)

=>出现BadStatusLine: ''错误

    conn = httplib.HTTPConnection("www.site.com");
    params  = urllib.urlencode({'val1':'123','val2':'abc','val3':'1b3'})
    conn.request("POST", "/nps/servlet/exportdatadownload", params)
    content = conn.getresponse()
    print content.reason, content.status
    print content.read()
    conn.close()
except:
    import sys
    print sys.exc_info()[:2]

输出:

Found 302

<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN">
<HTML><HEAD>
<TITLE>302 Found</TITLE>
</HEAD><BODY>
<H1>Found</H1>
The document has moved <A HREF="https://www.site.com/nps/servlet/exportdatadownload">here</A>.<P>
<HR>
<ADDRESS>Oracle-Application-Server-10g/10.1.3.5.0 Oracle-HTTP-Server Server at mp-www1.mrco.be Port 7778</ADDRESS>
</BODY></HTML>

我做错了什么?

4 个答案:

答案 0 :(得分:11)

你有没有理由使用urllibRequests几乎在所有方面都更简单,更好,并且抽象出使urllib难以使用的一些瑕疵。

作为一个例子,我将你的例子修改为:

import requests
resp = requests.post(url, data=values, allow_redirects=True)

此时,来自服务器的响应在resp.text中可用,您可以使用它执行您想要的操作。如果请求无法正确发送(例如,因为您需要自定义SSL证书),它应该会给您一个很好的错误消息,告诉您原因。

即使您不能在生产环境中执行此操作,也请在本地shell中执行此操作,以查看从requests获取的错误消息,并使用它来调试urllib

答案 1 :(得分:3)

BadStatusLine: '' (in httplib.py)表示此处可能还有其他内容。当服务器完全没有发回应答时,可能会发生这种情况,只是关闭连接。

正如您所提到的那样,您正在使用SSL连接,这可能对调试特别有意义(如果您愿意,可以使用curl -v URL)。 如果您发现curl -2 URL(强制使用SSLv2)似乎有效,而curl -3 URL(SSLv3)则不然,您可能需要查看问题#13636可能是#11220在python bugtracker上。取决于您的Python版本和可能配置错误的Web服务器,这可能会导致问题:SSL默认值在v2.7.3中已更改。

答案 2 :(得分:1)

   conn = httplib.HTTPSConnection(host='www.site.com', port=443, cert_file=_certfile)
   params  = urllib.urlencode({'cmd': 'token', 'device_id_st': 'AAAA-BBBB-CCCC',
                                'token_id_st':'DDDD-EEEE_FFFF', 'product_id':'Unit Test',
                                'product_ver':"1.6.3"})
    conn.request("POST", "servlet/datadownload", params)
    content = conn.getresponse().read()
    #print response.status, response.reason
    conn.close()

答案 3 :(得分:0)

服务器可能不喜欢丢失的标头,尤其是用户代理和内容类型。 Chrome图片会显示用于这些内容的内容。也许尝试添加标题:

import httplib, urllib

host = 'www.site.com'
url = '/servlet/datadownload'

values = {
  'val1' : '123',
  'val2' : 'abc',
  'val3' : '1b3',
}

headers = {
    'User-Agent': 'python',
    'Content-Type': 'application/x-www-form-urlencoded',
}

values = urllib.urlencode(values)

conn = httplib.HTTPSConnection(host)
conn.request("POST", url, values, headers)
response = conn.getresponse()

data = response.read()

print 'Response: ', response.status, response.reason
print 'Data:'
print data

这是未经测试的代码,您可能需要尝试添加其他标头值以匹配您的屏幕截图。希望它有所帮助。