【问题标题】:How to slice the dataset in Python in specific intervals如何以特定间隔在 Python 中对数据集进行切片
【发布时间】:2022-01-24 14:11:16
【问题描述】:

我有一个包含 n 行的数据集,如何使用 Python 访问整个数据集中每个特定行数的特定行数?

例如,在 100 行数据集中,我想每 10 行访问 10 行,例如 1:10、20:30、40:50、60:70、80:90

【问题讨论】:

  • 请提供足够的代码,以便其他人更好地理解或重现问题。

标签: sorting slice


【解决方案1】:

我能想到这样的事情

df.iloc[np.array([int(x/10) for x in df.index]) % 2 == 0]

它获取数据帧的索引,将其除以 10 并将其转换为 int。这基本上只是删除了这个例子中的最后一个数字。

使用取模语句,前 10 行是 True,接下来的 10 行是 False,依此类推。然后将其与 iloc 一起使用以获取具有 True 值的行。

这需要不断增加的索引。例如,如果某些行已被过滤掉,则情况并非如此。 reset_index 可用于重置索引。

【讨论】:

    猜你喜欢
    • 2020-12-05
    • 1970-01-01
    • 1970-01-01
    • 2020-10-10
    • 2018-06-15
    • 1970-01-01
    • 1970-01-01
    • 2018-07-08
    • 1970-01-01
    相关资源
    最近更新 更多