从不同网站编译大量信息的最有效方法

时间:2016-08-22 22:53:44

标签: python

我的问题在于工作我必须点击网站链接,然后将公司名称,公司电话号码和公司地址复制到Excel电子表格中,每个电子表格都在不同的列中。这些信息在每个网站上都在同一个地方,只是耗费时间,因为我必须点击每个链接,然后复制并粘贴信息。

我对Python编程语言有所了解,我只是想知道最好的方法是使用该语言搜索网站的来源,只留下相关信息或是否使用其他编程语言。此外,有关图书馆的任何建议,以阅读指导?

2 个答案:

答案 0 :(得分:1)

您可以将BeautifulSoup与requests / urllib结合使用来搜索和解析网站的源代码。

然后,您可以使用Openpyxl将数据写入Excel电子表格。

答案 1 :(得分:0)

之前我曾使用Beautiful Soup Python库进行此类工作。它以一种方式组织所有HTML代码,您可以轻松地从中提取所需的任何数据。您可以在此处查看示例:https://www.crummy.com/software/BeautifulSoup/bs4/doc/