【问题标题】:I do not understand when to use a Pandas Series and when to use a Pandas Single Column Dataframe我不明白何时使用 Pandas 系列以及何时使用 Pandas 单列数据框
【发布时间】:2020-04-29 05:04:17
【问题描述】:

我已经做了很多搜索,看到了很多解释差异的帖子,但我没有遇到明确的用例。我确实理解一般的差异,但我想知道为什么我应该学习如何使用 Series,因为单列 Dataframe 似乎可以执行 Series 可以执行的所有操作。

基本上我无法将我对它们差异的理解推断为“我什么时候应该使用 Series 或 Dataframe 来完成我面前的任务?”。

【问题讨论】:

  • 这里还有关于 SO 的相同/类似问题:stackoverflow.com/questions/26047209/…
  • 在许多情况下,您选择哪一个并不重要。但是,如果您从单个列开始,然后在分析中计划添加其他列,则最好从 1 列开始DataFrame。这将帮助您避免对 Series 和 DataFrame 的某些操作进行不同处理的问题。例如 Series['x'] = 5 分配索引为 'x' 的单行值为 5(因为 Series 是一维的),而 DataFrame['x'] = 5 分配另一列,标记为 'x' , DataFrame 中存在的所有行的值为 5。
  • @Emrah Diril 没有回答这样的问题link。事实上,有 2 个 cmets 这么说。这个问题是我在寻找问题答案时所关注的问题之一。
  • 嗯,现在有答案了,很详细,这个:stackoverflow.com/a/26240208/30581

标签: python pandas


【解决方案1】:

以下是我的简短解释:

  • Series:序列是一维数据,就像lists有很多功能一样。

  • DataFrame:DataFrames 是针对多维数据的,就像嵌套的lists 有很多功能一样。

转到docs 了解更多信息。

Series 来自docs

Series 是一个一维标记数组,能够保存任何数据类型(整数、字符串、浮点数、Python 对象等)。轴标签统称为索引

DataFrame 来自docs

DataFrame 是一种二维标记数据结构,其中包含可能不同类型的列。您可以将其视为电子表格或 SQL 表,或 Series 对象的字典。它通常是最常用的 pandas 对象。

【讨论】:

  • 你的回答并没有以任何方式回答我的问题。我会再次问这个问题**“我什么时候应该使用 Series 或 Dataframe 来完成我面前的任务?”** 所以我需要一个明确定义的任务,然后解释为什么一个比另一个更适合......
猜你喜欢
  • 2020-10-10
  • 2015-08-11
  • 2019-06-24
  • 2021-08-21
  • 1970-01-01
  • 2018-09-26
  • 1970-01-01
  • 2018-04-13
  • 1970-01-01
相关资源
最近更新 更多