如何同时运行多个Spark Streaming批处理作业?

时间:2018-08-31 14:41:28

标签: apache-spark spark-streaming

我一直在使用Spark流处理Spark 2.1.0中的数据。

9个接收器通过流传输以10秒的间隔接收数据。 自从我提交流媒体应用程序以来,平均处理时间约为10秒。但是,排队的批次延迟了超过一天。

队列在驱动程序中吗?还是在每个接收者执行器中?

在Active Batch处理中,除9个接收方外,仅处理一个真实数据处理批次。因此,总是只有10个批次在运行。

我在询问如何增加处理数据的活动批次的数量。

并且一次只有一个Streaming Batch作业。我在SparkConf中将spark.scheduler.mode设置为FAIR,并将调度池设置为fair,但是批处理作业一次只能运行一个。

在spark作业调度指南中,公平池应该在同一池中作为FIFO运行。是这样吗?

如何同时运行多个Spark Streaming批处理作业?

  • 火花流运行Spark-Yarn客户端模式
  • 8个节点群集,1个节点:32core,128G
  • executor_memory:6克
  • executor_cores:4
  • 驱动程序内存:4克
  • sparkConf.set(“ spark.scheduler.mode”,“一般”)
  • ssc.sparkContext.setLocalProperty(“ spark.scheduler.pool”, “生产”)
  • 生产是公平的
  • sparkConf.set(“ spark.dynamicAllocation.enabled”,false)

0 个答案:

没有答案