【发布时间】:2018-11-29 01:26:41
【问题描述】:
我有两个结构几乎相同的 DataFrame,我想同时对它们执行数据转换/清理。为此,我创建了一个包含这两个 DF 的列表并循环遍历该列表。
例如:
train = pd.read_csv('train.csv')
test = pd.read_csv('test.csv')
combined = [train, test]
for dataset in combined:
dataset = dataset.drop(['Age'], axis =1)
print(dataset.head())
for 循环中的最终打印语句工作正常——“年龄”列被删除。但是,如果我立即调用 train.head(),则删除的列仍然存在于 DataFrame 中。就好像正在创建“train”和“test”的两个副本——“combined”列表中的副本和外部的副本。我需要做些什么来使这些更改持续存在吗?
这似乎应该如此简单,这让我发疯了!
【问题讨论】:
标签: python pandas dataframe for-loop