【问题标题】:Receiving SettingWithCopyWarning. Is it safe to proceed?接收 SettingWithCopyWarning。继续进行是否安全?
【发布时间】:2019-04-10 23:29:22
【问题描述】:

我正在尝试用仅包含 contains() 方法中的字符串的行替换 DataFrame london(这是另一个 no_eco 的副本)中的列 'let'。代码如下:

london = no_eco
london.loc[:,'let'] = london.loc[:,'let'].str.contains('E' or 'D' or 'F' or 'G' or 'H' or 'I' or 'J')
london.loc[:,'let'] = london.loc[:,'let'][london.loc[:,'let']]
london = london.dropna(subset = ['let'])
print(london)

代码有效,我删除了不符合字符串的行,但是我收到以下警告:

C:\Users\gerardchurch\AppData\Local\Continuum\anaconda3\lib\site-packages\pandas\core\indexing.py:543: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas- docs/stable/indexing.html#indexing-view-versus-copy

在查看文档时,我仍然无法理解我做错了什么。

可以继续使用变量london 还是我以后会遇到问题?

谢谢。

【问题讨论】:

  • london.loc[:,'distId'][london.loc[:,'distId']] 更改为london.loc[london.loc[:,'distId'],'distId'],警告就会消失。不确定在这种情况下它是否特别有害,因为您是在作业的 RHS 上进行的。

标签: python pandas dataframe indexing chained-assignment


【解决方案1】:

您的代码有几个问题:

  1. london = no_eco 没有为london 分配副本。明确:london = no_eco.copy()
  2. pd.Series.str.contains默认支持正则表达式,所以使用str.contains('E|D|F|G|H|I|J|')
  3. 您的逻辑混乱。您首先将 object dtype 系列替换为布尔系列,然后为其分配一个由自身索引的子集,然后使用专为 null 值设计的 dropna

相反,只需构造一个布尔序列并将pd.DataFrame.loc 与布尔索引一起使用:

london = no_eco.copy()
london = london.loc[london['let'].str.contains('E|D|F|G|H|I|J|')]

对于这种特殊情况,您可以直接使用pd.DataFrame.__getitem__df[] 语法):

london = no_eco.copy()
london = london[london['let'].str.contains('E|D|F|G|H|I|J|')]

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2012-03-24
    • 1970-01-01
    • 1970-01-01
    • 2012-11-15
    • 2016-04-18
    • 2017-02-17
    • 1970-01-01
    相关资源
    最近更新 更多