Spark ML广播模型一次

时间:2017-08-04 04:13:16

标签: spark-streaming apache-spark-mllib apache-spark-ml

背景:我有一个spark-ml训练的随机森林模型。我正在读取来自Kafka(流媒体)的数据,这些数据将通过模型,预测将保存在数据库中。

我想要的是:我想加载我的模型一次,只在我的应用程序启动时广播该模型,并且只在我想要时重新部署。

我的理解:模型会为每个微批次加载和广播。

问题:如何让我的模型只加载一次而不是每次微批加载,以便它一直持续到最后。

任何指针都将受到赞赏。

0 个答案:

没有答案