从网站导出数据

时间:2011-08-10 09:13:04

标签: web-scraping web data-mining

我想创建一个应用程序,它将从Google书籍等网站(例如每本书的标签)中导出一些我将选择的数据。你能告诉我哪种语言最好或首选,以及如何开始?给我看一些教程书和一个开始的路径...

1 个答案:

答案 0 :(得分:0)

取决于网站。通常不鼓励进行大规模数据爬行,因为它会在网站上造成不必要的服务器负载和流量。但是,很多人经常会找到一些提供API的网站,以便直接与数据库进行通信。

因此,请检查网站并尝试查找是否提供了某种可以使用的编程语言编写的数据API。然后编写一个使用API​​提取所需数据的小程序。