【发布时间】:2022-01-16 05:11:27
【问题描述】:
过去几天我一直在尝试使用 wget 或 curl 等工具从下一页的命令行自动保存为表格或文本文件,但没有成功。问题还来自于 url 被屏蔽的事实。我想知道是否有可能使用 selenium 之类的工具来做到这一点。
https://www.hkex.com.hk/Market-Data/Securities-Prices/Equities?sc_lang=en
在将页面保存为表格之前,基本上需要做两个操作:
a) 单击右下角的“20 个项目”,将其带到“100 个项目”
b) 点击页面中下方的“LOAD MORE”链接10次,以增加显示项目的数量
对于如何解决此任务的任何建议,我将不胜感激。 感谢您的考虑。
【问题讨论】:
-
你试过puppeteer吗? github.com/puppeteer/puppeteer
-
@masterguru 感谢您的指出。看起来是个有趣的工具,但我想它的学习曲线相当陡峭。
-
@Cyrus。感谢您指出此资源,但他们的 API 仅允许获取单个项目的数据。因此,我需要拨打大约 1000 次电话才能获取我需要的所有物品,这对他们的系统造成了压力。
标签: selenium curl selenium-chromedriver wget geckodriver