获取 Julia 数据帧中一行的索引(类似 iterrows?)

时间:2021-02-05 01:04:53

标签: dataframe indexing iteration julia

在 Julia 中遍历 df 时,有什么方法可以获取行的索引和行对象?如果没有,即使找到一行索引的方法也会很棒,因为我可以简单地使用 eachrow() 然后找到迭代行的索引,尽管我认为这不太可能考虑到命名 df 的索引是Julia 确实支持。

对于上下文,我需要索引以便在 df 的每一列中找到 0 的第一次出现,以便我可以用另一个值(例如 99)替换它。为此,我想遍历 df 中每列的所有行。例如对于 df = DataFrame(a = [1, 0, 2], b = [0, 1, 0], c = [0, 0, 4]) 代码:

for col_index in ["a", "b", "c"]
    for row in eachrow(select(df, :i))
        if row[1] == 0
            df[row.index, :i] = 99
            break
        end
    end
end

会将 df 变成

1 99 99
99 1 0 
2 0 4

很抱歉,如果这是一个愚蠢的问题,尽管我在网上找不到任何与我的任何一个目标相关的内容。

2 个答案:

答案 0 :(得分:1)

  1. 您可以使用 rownumber 函数获取数据框中的行号,DataFrameRow 取自该数据框中。
  2. 由于 DataFrameRow 是可变的,您可以像这样编写循环:
for col_index in ["a", "b", "c"]
    for row in eachrow(df)
        if row[col_index] == 0
            row[col_index] = 99
            break
        end
    end
end
  1. 最后,像这样做你想做的事情会更快:
for col_index in ["a", "b", "c"]
    col = df[!, col_index]
    loc = findfirst(==(0), col)
    isnothing(loc) || (col[loc] = 99)
end

答案 1 :(得分:0)

通过使用 enumerate(eachrow(df)) h/t @Antonello,您可以获得足够好的东西。

从我在问题中写的玩具代码来看,这看起来像:

for col_index in ["a", "b", "c"]
    for (row_index, row) in enumerate(eachrow(select(df, :col_index)))
        if row[1] == 0
            df[row_index, :col_index] = 99
            break
        end
    end
end
相关问题