电子邮件刮板使用python美丽的汤或html模块

时间:2018-09-16 15:26:05

标签: python html web-scraping gmail

当前,我正在尝试从她的经纪人发送给我的列表中收集房地产经纪人的数据。它总是通过来自主站点“ Is there an equivalent to the Scanner class in C# for strings?”的链接来实现的,我认为只有房地产经纪人才能进入该站点并筛选房屋,但是当她将其发送给我时,我可以看到房屋清单。

我想知道是否可以创建一个Python脚本:)

1)打开Gmail 2)过滤她的电子邮件 3)打开她的一封电子邮件 4)点击链接 5)将房屋数据刮成CSV格式

我不确定这样做的可行性,我从未使用python刮过网页。我可以看到第5步可行,但是如何执行第1步到第4步?

1 个答案:

答案 0 :(得分:1)

是的,这是可能的,但是您需要事先收集一些要求以确定可以消除过程的哪些部分。例如,如果您的房地产经纪人每次都向您发送相同的链接,那么您可以直接定位该网址。例如,如果链接更改了,但按月份进行了参数化,则只需在要处理结果时每月调整网址。

要发出请求,我建议使用requests包和bs4(BeautifulSoup 4)来定位元素。创建CSV文件时,您可以选择使用csv,但是如果您需要更特定于用例的内容,则有很多选择。