【发布时间】:2011-10-23 22:00:58
【问题描述】:
我想制作一个应用程序,它可以从 Google 图书之类的网站(例如每本书的标签)中导出一些我会选择的数据。你能告诉我哪种语言是最好的或首选的语言,以及如何开始?给我看一些教程书籍和开始的路径......
【问题讨论】:
标签: web-scraping web data-mining
我想制作一个应用程序,它可以从 Google 图书之类的网站(例如每本书的标签)中导出一些我会选择的数据。你能告诉我哪种语言是最好的或首选的语言,以及如何开始?给我看一些教程书籍和开始的路径......
【问题讨论】:
标签: web-scraping web data-mining
取决于网站。通常不鼓励大规模数据抓取,因为它会在网站上造成不必要的服务器负载和流量。但是,您经常会发现一些网站提供了直接与数据库通信的 API。
因此,请检查该网站并尝试查找它们是否提供某种以您可以使用的编程语言编写的数据 API。然后编写一个小程序,使用 API 来提取所需的数据。
【讨论】: