【发布时间】:2022-01-24 14:11:16
【问题描述】:
我有一个包含 n 行的数据集,如何使用 Python 访问整个数据集中每个特定行数的特定行数?
例如,在 100 行数据集中,我想每 10 行访问 10 行,例如 1:10、20:30、40:50、60:70、80:90
【问题讨论】:
-
请提供足够的代码,以便其他人更好地理解或重现问题。
我有一个包含 n 行的数据集,如何使用 Python 访问整个数据集中每个特定行数的特定行数?
例如,在 100 行数据集中,我想每 10 行访问 10 行,例如 1:10、20:30、40:50、60:70、80:90
【问题讨论】:
我能想到这样的事情
df.iloc[np.array([int(x/10) for x in df.index]) % 2 == 0]
它获取数据帧的索引,将其除以 10 并将其转换为 int。这基本上只是删除了这个例子中的最后一个数字。
使用取模语句,前 10 行是 True,接下来的 10 行是 False,依此类推。然后将其与 iloc 一起使用以获取具有 True 值的行。
这需要不断增加的索引。例如,如果某些行已被过滤掉,则情况并非如此。 reset_index 可用于重置索引。
【讨论】: