【发布时间】:2017-08-20 10:13:08
【问题描述】:
我有一个 pandas DataFrame,其中包含从几个 Wiki 表中抓取的数据。 DataFrame 有一列名称,其中一些名称后跟“\r\n(主教练)”。我想删除它,所以我尝试了这个:
df['name'][df.name.str.contains(r'coach')] =\
df['name'][df.name.str.contains(r'coach')].apply(lambda x: x[0:-14])
当它运行时,我得到一个 SettingWithCopyWarning。我尝试按照SO Q&A 中的建议使用 .loc:
mask = df.loc[:,'name'] == df['name'].str.contains(r'coach')
但是每个值都返回为 False,因此当我将它与我的 DataFrame 一起使用时,我得到一个空系列。
我不确定我哪里出了问题。有什么指点吗?
【问题讨论】:
标签: python regex pandas dataframe