读取标签值并存储到变量中

时间:2012-12-11 20:25:48

标签: python python-2.7

我正在尝试从网站读取数据并将数据存储到变量中。 例如:

http://www.example.com/example-info.php - >

姓名:Bob

地址:1234 Street

电话:000-000-0000

电子邮件:Bobs-email@nothing.com

我想要做的是从名称“名称”获取值,该值是Bob并将其存储到诸如“用户名”之类的变量中。或“电话”并将值存储到名为“Phone”的变量中。有人能指出我正确的方向。也许我需要使用Mechanize?

2 个答案:

答案 0 :(得分:0)

您是否正在尝试screen scrape该网站?如果是这样,使用requestsBeautifulSoup是值得关注的好事。

import requests
x = requests.get('http://www.google.com')
if x.status_code == 200:
    print x.content
上述场景中的

x.content将保存您发送请求的页面中的data / html。然后,您可以使用BeautifulSoup或regex来提取您需要的特定信息。

答案 1 :(得分:0)

您可以使用dict来存储您的键和值,以及翻译的映射字典

mapping = {"Telephone": "Phone", "Name": "Username"}
details = {}

details[mapping.get(web_key, web_key)] = web_value

所以例如

>>> web_dict = {"Name": "Bob", "Address": "1234 Street", "Telephone": "000-000-0000", "Email": "Bobs-email@nothing.com"}
>>>    
>>> for web_key, web_value in web_dict.iteritems():
...     details[mapping.get(web_key, web_key)] = web_value
...
>>> print details
{'Username': 'Bob', 'Phone': '000-000-0000', 'Email': 'Bobs-email@nothing.com', 'Address': '1234 Street'}

当然这只是答案的一半,你需要一些东西来解析html到词典中开始。