【问题标题】:read_html not finding all rows from tableread_html 没有从表中找到所有行
【发布时间】:2021-11-18 15:58:10
【问题描述】:

我正在尝试使用 pandas read_html 函数解析一个 html 表。

我发现head 方法由于某种原因删除了最后一行,所以我停止使用它。

但现在我注意到,虽然通过调试器可见(作为字符串),但另一行已被删除。所以head 我会有 5/7(行)和 6/7(行)没有。

这是我当前的代码:

r = get(f"site-censured").text
df = read_html(r)[0]

我正在访问这些值,就好像 df 是一个矩阵一样,就像 df[2][3]。

我做错了吗?

任何帮助都会很棒,谢谢

【问题讨论】:

  • Ciao Alberto 并欢迎您。如果您可以查看how-to-ask,然后尝试生成mcve,那就太好了。

标签: python html pandas


【解决方案1】:

在创建和测试 mcve 时,我发现了错误。我一直在从 1 循环到 df.shape[1],这将导致最后一行被忽略,所以我只需要添加 +1。 感谢rpanai的建议

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2020-12-22
    • 2019-08-17
    • 2019-04-23
    • 2016-05-27
    • 1970-01-01
    • 1970-01-01
    • 2018-03-28
    • 2015-02-05
    相关资源
    最近更新 更多