【发布时间】:2021-09-02 10:27:58
【问题描述】:
我正在尝试从 ccil 网站抓取数据。这些表被分成不同的页面,但所有页面都使用相同的 url。我正在使用 pandas 和 BeautifulSoup 来解析 HTML 代码,我只能抓取初始表,但我想要所有表中的全部数据。
请注意,此网站显示特定时间的数据。
我的链接是:-https://www.ccilindia.com/OMMWSG.aspx
我在stackoverflow上也看到过类似的查询,程序也在运行,但我不明白“数据”部分是从哪里获取的。
【问题讨论】:
-
我投票结束这个问题,因为该网站的隐私政策规定“本网站上的任何信息,包括文本和图形,都不得以任何形式复制或传播。是指未经 CCIL 的明确书面同意”,您试图违反此规定。
-
请停止编辑您的标题!
-
请不要通过破坏您的帖子为他人增加工作量。通过在 Stack Exchange (SE) 网络上发帖,您已根据 CC BY-SA license 授予 SE 分发内容的不可撤销权利(即无论您未来的选择如何)。根据 SE 政策,分发非破坏版本。因此,任何破坏行为都将被撤销。请参阅:How does deleting work? …。如果允许删除,则帖子下方左侧有一个“删除”按钮,但仅在浏览器中,而不是移动应用程序中。
标签: python