【问题标题】:obtain index of a row in Julia dataframe (analogue of iterrows?)获取 Julia 数据帧中一行的索引(类似于 iterrows?)
【发布时间】:2021-05-09 09:00:29
【问题描述】:

在 Julia 中迭代 df 时,有什么方法可以获取行和行对象的索引?如果不是,即使是找到行索引的方法也会很棒,因为我可以简单地使用eachrow() 然后找到迭代行的索引,尽管我认为这不太可能考虑到命名 df 的索引并不是真的Julia 支持。

对于上下文,我需要索引才能在 df 的每一列中找到第一次出现的 0,以便我可以将其替换为另一个值(例如 99)。为此,我想遍历 df 中每一列的所有行。例如对于 df = DataFrame(a = [1, 0, 2], b = [0, 1, 0], c = [0, 0, 4]) 代码:

for col_index in ["a", "b", "c"]
    for row in eachrow(select(df, :i))
        if row[1] == 0
            df[row.index, :i] = 99
            break
        end
    end
end

会把df变成

1 99 99
99 1 0 
2 0 4

对不起,如果这是一个愚蠢的问题,虽然我在网上找不到任何与我的任何一个目标有关的东西。

【问题讨论】:

  • 未测试,但enumerate 不适用于eachrow
  • 我不知道枚举与朱莉娅合作...谢谢!让我不用手动写一个计数器,哈哈。

标签: dataframe indexing iteration julia


【解决方案1】:
  1. 您可以使用rownumber 函数获取获取DataFrameRow 的数据框中的行号。
  2. 由于DataFrameRow 是可变的,您可以将循环编写为:
for col_index in ["a", "b", "c"]
    for row in eachrow(df)
        if row[col_index] == 0
            row[col_index] = 99
            break
        end
    end
end
  1. 最后,像这样更快地做你想做的事:
for col_index in ["a", "b", "c"]
    col = df[!, col_index]
    loc = findfirst(==(0), col)
    isnothing(loc) || (col[loc] = 99)
end

【讨论】:

    【解决方案2】:

    您可以使用enumerate(eachrow(df)) h/t @Antonello 获得足够好的东西。

    从我在问题中写的玩具代码来看,这看起来像:

    for col_index in ["a", "b", "c"]
        for (row_index, row) in enumerate(eachrow(select(df, :col_index)))
            if row[1] == 0
                df[row_index, :col_index] = 99
                break
            end
        end
    end
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2022-01-02
      • 2019-01-02
      • 1970-01-01
      • 2021-09-29
      • 1970-01-01
      • 2022-10-01
      • 1970-01-01
      • 2019-08-12
      相关资源
      最近更新 更多