pyspark计算一行中所有列的平均值

时间:2018-12-19 16:23:06

标签: python-3.x pyspark mean

我想在不指定所有列名称的情况下计算每列的平均值。

例如,而不是:

res = df.select([mean('col1'), mean('col2')])

我想做的事情等同于:

res = df.select([mean('*')])

有可能吗?

1 个答案:

答案 0 :(得分:0)

您可以通过

res  = df.select(*[f.mean(c).alias(c) for c in df.columns])
相关问题