【问题标题】:Missing data in a column of pandas dataframe熊猫数据框的一列中缺少数据
【发布时间】:2017-06-22 20:31:58
【问题描述】:

我正在创建一个数据框名称“salesdata”,它有一个列名“Outlet_Size”,此列包含一些缺失的数据。这是我的代码-:

#defining a dictionary
cat_dict ={}
#getting all the values of the column
outlet_size_values = salesdata.Outlet_Size.values
unique_outlet_size_val = list(set(outlet_size_values))  
print(unique_outlet_size_val)

我得到的输出是 [nan,'高','中','小'] 我不希望这个丢失的数据(nan)成为我列表的一部分,我不想为此创建一个新列表。

【问题讨论】:

    标签: python pandas data-science


    【解决方案1】:

    您可以使用numpy.unique

    import pandas as pd
    import numpy as np
    
    np.unique(salesdata.Outlet_Size.dropna().values)
    

    【讨论】:

      【解决方案2】:

      使用基本的 pandas 函数:dropna 删除 nan 值,然后 unique 获得集合等效结果:

      salesdata.Outlet_Size.dropna().unique()
      

      【讨论】:

        【解决方案3】:

        pandas 具有函数unique 来获取不同的值。您可以使用它并过滤掉 NaN,例如

        salesdata.loc[~salesdata.Outlet_Size.isnull(), 'Outlet_Size'].unique()
        

        【讨论】:

          猜你喜欢
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 2021-12-18
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          相关资源
          最近更新 更多