Python迭代插补

时间:2019-12-05 21:53:18

标签: python loops dataframe missing-data imputation

  

我有一个要缺失的数据集,该数据集需要使用每个国家/地区随时间推移每个国家/地区在每个要素中使用的现有数据的StdDev /均值

我想设置一个循环/迭代,该循环使用groupby和lambda或forloop遍历各个组,并迭代估算缺失的值。

当前DF:

(有3年多,3个国家和3个功能)

[country, feature, year, value]

USA  A  1995  8
USA  B  1995  NaN
USA  C  1995  326
USA  A  1996  14
USA  B  1996  42
USA  C  1996  NaN
USA  A  1997  NaN
USA  B  1997  50
USA  C  1997  400

CHN  A  1995  6
CHN  B  1995  34
CHN  C  1995  NaN

CHN  A  1996  NaN
CHN  B  1996  NaN
CHN  C  1996  381

CHN  A  1997  23
CHN  B  1997  54
CHN  C  1997  412

grp = df.groupby(['country', 'series'])

for country, group in grp: 

    return ????Some Iteration????

  

预期的输出将返回具有每个国家/地区相对于每个要素的标准误(StdDev)值的NaN值的df。

     
    

不是 所有功能/所有国家/地区整体的标准差。

  

感谢所有输入。

0 个答案:

没有答案
相关问题