【发布时间】:2016-10-03 15:20:13
【问题描述】:
我知道DataFrame.sample(),但我怎样才能做到这一点并从数据集中删除样本? (注意:AFAIK 这与替换抽样无关)
例如这里是我想要实现的本质,这实际上不起作用:
len(df) # 1000
df_subset = df.sample(300)
len(df_subset) # 300
df = df.remove(df_subset)
len(df) # 700
【问题讨论】:
我知道DataFrame.sample(),但我怎样才能做到这一点并从数据集中删除样本? (注意:AFAIK 这与替换抽样无关)
例如这里是我想要实现的本质,这实际上不起作用:
len(df) # 1000
df_subset = df.sample(300)
len(df_subset) # 300
df = df.remove(df_subset)
len(df) # 700
【问题讨论】:
【讨论】:
pop 似乎只接受单列名称。意思是,我不能轻易弹出多个。
train=df.sample(frac=0.8,random_state=200)
test=df.drop(train.index)
【讨论】: