Question

我有一个要缺失的数据集，该数据集需要使用每个国家/地区随时间推移每个国家/地区在每个要素中使用的现有数据的StdDev /均值。

我想设置一个循环/迭代，该循环使用groupby和lambda或forloop遍历各个组，并迭代估算缺失的值。

当前DF：

（有3年多，3个国家和3个功能）

[country, feature, year, value]

USA  A  1995  8
USA  B  1995  NaN
USA  C  1995  326
USA  A  1996  14
USA  B  1996  42
USA  C  1996  NaN
USA  A  1997  NaN
USA  B  1997  50
USA  C  1997  400

CHN  A  1995  6
CHN  B  1995  34
CHN  C  1995  NaN

CHN  A  1996  NaN
CHN  B  1996  NaN
CHN  C  1996  381

CHN  A  1997  23
CHN  B  1997  54
CHN  C  1997  412

grp = df.groupby(['country', 'series'])

for country, group in grp: 

    return ????Some Iteration????

预期的输出将返回具有每个国家/地区相对于每个要素的标准误（StdDev）值的NaN值的df。


不是所有功能/所有国家/地区整体的标准差。

感谢所有输入。

Python迭代插补

当前DF：

0 个答案: