【问题标题】:analyzing excel using pandas使用熊猫分析excel
【发布时间】:2016-09-30 23:03:54
【问题描述】:

我想分析 excel 文件并找出数据范围(最小值、最大值、最小长度、最大长度、空白等)我想创建一个新的分析文件来吐出这些见解。我正在研究panda 库可以做到这一点。

df = pd.read_excel(open('file.xlsx','rb'), sheetname='TestData')

我应该如何进行?

【问题讨论】:

    标签: python excel csv pandas


    【解决方案1】:

    使用 numpy 获取最小值/最大值等。不过,这些函数需要 numpy 数组,因此要么对数据帧的每一列进行切片,要么将数据帧转换为矩阵

    https://docs.scipy.org/doc/numpy/reference/generated/numpy.argmax.html

    【讨论】:

      【解决方案2】:

      您可以找到一些您正在寻找的统计数据 - 最小值、最大值、平均值(平均值)、标准值。使用describe() 方法的数值列的偏差

      演示:

      df = pd.read_excel(r'/path/to/file.xlsx')
      
      In [35]: df
      Out[35]:
         a  b  c txt
      0  8  5  2  dd
      1  6  6  2  aa
      2  3  7  9  cc
      3  4  2  3  dd
      4  3  3  5  cc
      
      In [36]: df.describe()
      Out[36]:
                    a         b         c
      count  5.000000  5.000000  5.000000
      mean   4.800000  4.600000  4.200000
      std    2.167948  2.073644  2.949576
      min    3.000000  2.000000  2.000000
      25%    3.000000  3.000000  2.000000
      50%    4.000000  5.000000  3.000000
      75%    6.000000  6.000000  5.000000
      max    8.000000  7.000000  9.000000
      

      【讨论】:

        猜你喜欢
        • 2023-01-02
        • 2020-10-19
        • 2023-02-05
        • 2020-11-12
        • 2014-08-21
        • 1970-01-01
        • 2021-09-26
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多