如何将正在运行的作业链接到火花转换

时间:2018-11-01 10:32:56

标签: scala apache-spark pyspark

我有一个Spark作业应用程序中所有活动作业的列表。

sc.statusTracker.getActiveJobIds().foreach(jobId => { 
    val job: SparkJobInfo = sc.statusTracker.getJobInfo(jobId).get
    ...
})

我有一段代码,做了一些基本的转换和动作。 例如:

val oldDf = dfInput.filter(age > 18)
val youngDf = dfInput.filter(age < 10)
oldDf.count()
youngDf.count()

如何在jobId和适当的转换之间链接?如何访问正在运行的作业的名称?
我的最终目标是要统计作业1中完成了多少任务,我想将作业1与 age> 18 过滤器转换链接。

谢谢。

0 个答案:

没有答案