【发布时间】:2018-09-06 03:46:29
【问题描述】:
我有以下数据框:
df = pd.DataFrame([[1,2,3,3],[10,20,2,],[10,2,5,],[1,3],[2]],columns = ['a','b','c','d'])
从这个 DataFrame 中,我想删除子集 ['b', 'c', 'd'] 中所有值都为 NA 的行,这意味着应该删除最后一行。
以下代码有效:
df.dropna(subset=['b', 'c', 'd'], how = 'all')
但是,考虑到我将使用更大的数据帧,我想使用范围 ['b':'d'] 选择相同的子集。如何选择这个子集?
【问题讨论】:
-
@ayhan 是的,类似的,除了我意识到
:可能会导致昂贵的副本:-) -
@cᴏʟᴅsᴘᴇᴇᴅ 是的,我正在调查
columns.slice_locs以避免这种情况,但你的是一个不错的黑客。 :)