获取 Julia 数据帧中一行的索引（类似于 iterrows？）答案

【问题标题】：obtain index of a row in Julia dataframe (analogue of iterrows?)获取 Julia 数据帧中一行的索引（类似于 iterrows？）
【发布时间】：2021-05-09 09:00:29
【问题描述】：

在 Julia 中迭代 df 时，有什么方法可以获取行和行对象的索引？如果不是，即使是找到行索引的方法也会很棒，因为我可以简单地使用eachrow() 然后找到迭代行的索引，尽管我认为这不太可能考虑到命名 df 的索引并不是真的Julia 支持。

对于上下文，我需要索引才能在 df 的每一列中找到第一次出现的 0，以便我可以将其替换为另一个值（例如 99）。为此，我想遍历 df 中每一列的所有行。例如对于 df = DataFrame(a = [1, 0, 2], b = [0, 1, 0], c = [0, 0, 4]) 代码：

for col_index in ["a", "b", "c"]
    for row in eachrow(select(df, :i))
        if row[1] == 0
            df[row.index, :i] = 99
            break
        end
    end
end

会把df变成

1 99 99
99 1 0 
2 0 4

对不起，如果这是一个愚蠢的问题，虽然我在网上找不到任何与我的任何一个目标有关的东西。

【问题讨论】：

未测试，但enumerate 不适用于eachrow？
我不知道枚举与朱莉娅合作...谢谢！让我不用手动写一个计数器，哈哈。

标签： dataframe indexing iteration julia

【解决方案1】：

您可以使用rownumber 函数获取获取DataFrameRow 的数据框中的行号。
由于DataFrameRow 是可变的，您可以将循环编写为：

for col_index in ["a", "b", "c"]
    for row in eachrow(df)
        if row[col_index] == 0
            row[col_index] = 99
            break
        end
    end
end

最后，像这样更快地做你想做的事：

for col_index in ["a", "b", "c"]
    col = df[!, col_index]
    loc = findfirst(==(0), col)
    isnothing(loc) || (col[loc] = 99)
end

【讨论】：

【解决方案2】：

您可以使用enumerate(eachrow(df)) h/t @Antonello 获得足够好的东西。

从我在问题中写的玩具代码来看，这看起来像：

for col_index in ["a", "b", "c"]
    for (row_index, row) in enumerate(eachrow(select(df, :col_index)))
        if row[1] == 0
            df[row_index, :col_index] = 99
            break
        end
    end
end

【讨论】：