Python请求HTTP页面并使用源信息

时间:2013-05-14 01:10:22

标签: python python-2.7 python-2.6

我正在寻求使用python的网页并获取字符串的源代码(我的页面只包含文字,例如,2012年没有html或其他代码,所以如果你查看源代码,你会看到2012年这是我需要的)

例如我在Python中使用了这个C#代码:

string WebClient = new WebClient().DownloadString(WebPage);

如果我创建myscript.php并输入Year2012字符串,WebClient将=“Year2012”如果我稍后更改它并且我的程序检查网页,那将是我改变的内容。我想要同样的东西在python for windows中有什么想法吗?

谢谢!

1 个答案:

答案 0 :(得分:3)

我建议你使用 requests 这个包。这是一个可以满足你需求的代码snipet:

import requests
r = requests.get('https://github.com/timeline.json')

修改

或者你可以在python中使用默认包:urllib2,一个简单的例子:

import urllib2
f = urllib2.urlopen('http://www.python.org/')
print f.read(100)

输出:

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<?xml-stylesheet href="./css/ht2html