我有一个要缺失的数据集,该数据集需要使用每个国家/地区随时间推移每个国家/地区在每个要素中使用的现有数据的StdDev /均值。
我想设置一个循环/迭代,该循环使用groupby
和lambda或forloop遍历各个组,并迭代估算缺失的值。
(有3年多,3个国家和3个功能)
[country, feature, year, value]
USA A 1995 8
USA B 1995 NaN
USA C 1995 326
USA A 1996 14
USA B 1996 42
USA C 1996 NaN
USA A 1997 NaN
USA B 1997 50
USA C 1997 400
CHN A 1995 6
CHN B 1995 34
CHN C 1995 NaN
CHN A 1996 NaN
CHN B 1996 NaN
CHN C 1996 381
CHN A 1997 23
CHN B 1997 54
CHN C 1997 412
grp = df.groupby(['country', 'series'])
for country, group in grp:
return ????Some Iteration????
预期的输出将返回具有每个国家/地区相对于每个要素的标准误(StdDev)值的NaN值的df。
不是 所有功能/所有国家/地区整体的标准差。
感谢所有输入。