【问题标题】:Pandas Coding practice: Is it better to build functions returning a DataFrame or Series?Pandas 编码实践:构建返回 DataFrame 或 Series 的函数是否更好?
【发布时间】:2015-02-21 11:21:37
【问题描述】:

Pandas 编码实践:构建返回 DataFrame 或 Series 的函数更好吗?

这是一个非常基本的问题(如果已经问过,还有 apols),但很高兴听到对此的看法。我倾向于系列,因为它似乎是一个更基本的构建块(即索引到 df 接收系列),但可以应用于系列的功能有一些限制。同样,基本论点可以更进一步,我开始失去开发速度的 numpy 数组。

【问题讨论】:

  • 您还没有定义函数的使用方式或您面临的 wrt Series 与 DataFrame 的限制,有不同的方法可用,但这应该不是问题
  • 这对我来说就像是在问编写返回整数或浮点数的函数是否更好的编码实践 - 这实际上取决于您使用该函数的目的。

标签: python pandas


【解决方案1】:

在执行函数时,您应该考虑的最明显的限制是内存。有很多技术可以估计内存使用情况(链接如下),包括编写你的数据帧做 .csv 文件和检查它们的 dbytes()。但是,如果您要管理一个小型数据集,那么管理多个数据框应该不是问题。

How to estimate how much memory a Pandas' DataFrame will need?

也就是说,您还可以构建多个函数并查看它们的核心处理时间统计信息:

What do 'real', 'user' and 'sys' mean in the output of time(1)?

如果没有围绕上述问题的明确性/具体性,我真的无法提供更多细节。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2017-08-08
    • 2020-07-20
    • 2023-01-23
    • 1970-01-01
    • 2021-01-14
    • 1970-01-01
    • 2015-12-01
    • 1970-01-01
    相关资源
    最近更新 更多