【问题标题】:Percentile of every column and row in a dataframe数据框中每列和每行的百分位数
【发布时间】:2019-08-03 17:06:20
【问题描述】:

我有一个如下图所示的 csv。我想计算从 B2 到 X2 的每一行的百分位数(10,50,90),并将最后的百分位数添加到新列中。本质上,我想找到整个可用记录期间的平均值(std、cv、sp_tim.....)值的第 10 个百分点。

到目前为止,我已经创建了以下代码行以将其作为数据帧格式在 python 中读取。

da = pd.read_csv('Project/11433300_annual_flow_matrix.csv', index_col=0, parse_dates=True)

【问题讨论】:

    标签: pandas python-3.6 percentile


    【解决方案1】:

    如果我正确理解了您的问题,那么下面的代码可能对您有所帮助:

    我使用了一些虚拟数据,并对其进行了您正在寻找的类似处理

    aq = [1, 2, 2, 3, 3, 4, 4, 5, 7, 8, 10, 11]
    aw = [91, 25, 13, 53, 95, 94, 75, 35, 57, 88, 111, 12]
    df = pd.DataFrame({'aq': aq, 'aw': aw})
    
    n = df.shape[0]
    p = 0.1 #for 10th percentile
    position = np.ceil(n*p)
    position = int(position)
    df.iloc[position,]
    

    请看一下,让我知道这是否适合您。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2021-03-08
      • 2018-10-13
      • 1970-01-01
      • 2021-11-08
      • 2019-04-05
      • 2020-02-05
      • 2019-07-06
      • 2017-05-17
      相关资源
      最近更新 更多