【发布时间】:2015-03-18 20:44:37
【问题描述】:
我正在考虑构建一个应用程序来检查各个商店的库存水平。一些商店没有公开此信息的 API。
我正在考虑为每个网站构建一个爬虫。
你认为这会奏效吗?我可以只构建一个脚本来检查所有站点吗?例如,这是来自一个站点的标记:
<div class = "stock status6">
<b> In stock </b>
</div>
所以我的脚本需要解析这个来提取股票信息。
据我了解,这种技术的问题在于,如果网站更改了标记,那么我的抓取工具可能会停止工作。
当某个 API 不可用时,如何获得使用 API 的好处? Javascript 可以在这里提供帮助吗?
【问题讨论】:
标签: api web-scraping