【问题标题】:How to fill the nulls with conditions in python?如何在python中用条件填充空值?
【发布时间】:2020-07-20 13:50:51
【问题描述】:

我有一个数据框

import pandas as pd
import numpy as np

df = pd.DataFrame(np.nan, index=range(1,19), columns=['A','B','C','D','E','F','G','H'])

a = [1550, 41, 9.41, 22.6, 4.74, 3.2, 11.64, 2.23]
b = [1540, 43, 9.41, 22.3, 4.84, 3.12, 11.64, 2.23]
c = [1590, 39, 9.41, 23.7, 4.74, 3.0, 11.64, 2.23]
d = [1540, 41, 9.41, 22.5, 4.74, 3.2, 11.64, 2.23]
e = [1580, 32, 9.27, 22.8, 4.82, 2.7,  12.2, 2.50]
f = [1550, 30, 9.00,  20,  4.50,  2.5,  10,   2.00]

df.loc[[1,8,13,15,16,18],:] = [a,b,c,d,e,f]

看起来像这样

    A        B       C       D        E     F         G     H
1   1550.0  41.0    9.41    22.6    4.74    3.20    11.64   2.23
2   NaN     NaN     NaN     NaN     NaN     NaN     NaN     NaN
3   NaN     NaN     NaN     NaN     NaN     NaN     NaN     NaN
4   NaN     NaN     NaN     NaN     NaN     NaN     NaN     NaN
5   NaN     NaN     NaN     NaN     NaN     NaN     NaN     NaN
6   NaN     NaN     NaN     NaN     NaN     NaN     NaN     NaN
7   NaN     NaN     NaN     NaN     NaN     NaN     NaN     NaN
8   1540.0  43.0    9.41    22.3    4.84    3.12    11.64   2.23
9   NaN     NaN     NaN     NaN     NaN     NaN     NaN     NaN
10  NaN     NaN     NaN     NaN     NaN     NaN     NaN     NaN
11  NaN     NaN     NaN     NaN     NaN     NaN     NaN     NaN
12  NaN     NaN     NaN     NaN     NaN     NaN     NaN     NaN
13  1590.0  39.0    9.41    23.7    4.74    3.00    11.64   2.23
14  NaN     NaN     NaN     NaN     NaN     NaN     NaN     NaN
15  1540.0  41.0    9.41    22.5    4.74    3.20    11.64   2.23
16  1580.0  32.0    9.27    22.8    4.82    2.70    12.20   2.50
17  NaN     NaN     NaN     NaN     NaN     NaN     NaN     NaN
18  1550.0  30.0    9.00    20.0    4.50    2.50    10.00   2.00

2,3,4,5,6,7中的空值应该用Average(1st row, 8th row)填充

9,10,11,12中的空值应该用Average(第8行和第13行)填充

第14行的空值应该填Average(第13行和第15行)

第17行的空值要填Average(第16行和第18行)

我有一个包含 5000 行的数据框。我希望以这种方式填充空值。

【问题讨论】:

    标签: python python-3.x pandas python-2.7 dataframe


    【解决方案1】:

    你可以试试ffill+bfill,然后取平均值

    df = (df.ffill()+df.bfill())/2
    

    【讨论】:

    • 很好,fillna() 在这里似乎是多余的?
    • @ScootCork 吼~
    猜你喜欢
    • 2020-11-06
    • 2020-10-02
    • 1970-01-01
    • 2022-07-23
    • 2020-07-30
    • 2021-07-29
    • 2020-08-11
    • 2018-01-16
    • 2021-05-18
    相关资源
    最近更新 更多