【发布时间】:2016-12-01 05:29:15
【问题描述】:
我正在尝试编写一个 for 循环来遍历我的索引,并且只保留那些有重复的。
我当前的数据框是两个合并在一起的
0.0102700 0.0308099 0.0616199 0.123240 \
5000000000010 4.330760e-05 4.442720e-05 9.232970e-05 1.994190e-04
5000000000238 6.006910e-04 6.041130e-04 1.220220e-03 2.500240e-03
...
.
0.00902317 0.0270695 0.0451159 0.0631622 \
5000000000010 6.962980e-05 7.063750e-05 7.165970e-05 7.269680e-05
5000000000234 4.638970e-04 4.716010e-04 4.794320e-04 4.873930e-04
.
New = pd.concat([SFR_low, SFR_high])
New = New.sort_index()
print(New)
0.00902317 0.0102700 0.0270695 0.0308099 \
5000000000010 6.962980e-05 NaN 7.063750e-05 NaN
5000000000010 NaN 4.330760e-05 NaN 4.442720e-05
5000000000081 6.299210e-05 NaN 6.299320e-05 NaN
5000000000082 NaN 8.176550e-04 NaN 8.172630e-04
我需要一个只保留具有重复索引的行的新数据框。
【问题讨论】:
-
请编辑问题并添加您的代码和 DataFrame(或其中的一部分)
-
现在才这样做,但我还没有任何代码,因为这些文件刚刚被读入。
-
您要保留值、行还是列?并在哪里复制?在同一行、同一列或整个表中?请尝试一些东西,如果你失败了,那就重做这个问题。这可能会帮助您找到消除重复项所需的代码chrisalbon.com/python/pandas_dataframe_count_values.html 有一些代码可以检查 DataFrames 上的频率。祝你好运。
标签: python loops pandas indexing iteration