如何获得与聚合函数关联的行?

时间:2019-04-26 20:21:53

标签: python pyspark

我正在用3列(文档,部门,dispatch_date)的数据帧编写一个火花查询,其中同一文档可以多次发送到多个部门。我正在尝试获取每个文档以及获得文档的部门的最新信息。

我试图按发送日期对数据框进行排序,并获取部门和日期的第一个数据,但无济于事-spark按字母顺序返回第一个部门,而无论最后接收者是否为接收者。

0 个答案:

没有答案