从urllib2中第一个站点的onload上的目标URL获取html内容

时间:2012-09-12 08:29:05

标签: python urllib2

我正在尝试使用urllib2获取网站的HTML内容。该网站有一个 onload event 正文,可以在此网站上提交表单,因此会转到目标网站并呈现我需要的详细信息。

response = urllib2.urlopen('www.xyz.com?var=999-999')

  

www.xyz.com包含一个发布到“www.abc.com”的表格   动作值取决于url'var = 999-999'中的内容   这意味着如果var值变为,则动作值将发生变化   '888-888'

response.read()

  

这仍然给了我“www.xyz.com”的html内容,但我想要   由此产生的动作网址。任何获取html的建议   最后一页的内容?

提前致谢

1 个答案:

答案 0 :(得分:1)

你必须弄清楚第二页的调用,包括发送的参数,这样你就可以从你的python代码中自己调用,最好的方法是在打开谷歌浏览器页面检查器的情况下浏览第一页,然后转到网络选项卡。将捕获POST呼叫,您可以看到发送的参数和所有参数。然后只需从urllib2重新创建相同的POST调用。

相关问题