如何以特定间隔在 Python 中对数据集进行切片

【问题标题】：How to slice the dataset in Python in specific intervals如何以特定间隔在 Python 中对数据集进行切片
【发布时间】：2022-01-24 14:11:16
【问题描述】：

我有一个包含 n 行的数据集，如何使用 Python 访问整个数据集中每个特定行数的特定行数？

例如，在 100 行数据集中，我想每 10 行访问 10 行，例如 1:10、20:30、40:50、60:70、80:90

【问题讨论】：

【解决方案1】：

我能想到这样的事情

df.iloc[np.array([int(x/10) for x in df.index]) % 2 == 0]

它获取数据帧的索引，将其除以 10 并将其转换为 int。这基本上只是删除了这个例子中的最后一个数字。

使用取模语句，前 10 行是 True，接下来的 10 行是 False，依此类推。然后将其与 iloc 一起使用以获取具有 True 值的行。

这需要不断增加的索引。例如，如果某些行已被过滤掉，则情况并非如此。 reset_index 可用于重置索引。

【讨论】：