从Spark 2.2到2.3的结构化流有什么区别?

时间:2018-07-25 14:42:05

标签: spark-streaming

我在Spark 2.3的发行说明中看到了结构化流的公告/发布,但是我知道它已经存在了一段时间。由于某些依赖性,我需要在系统实现中使用Spark 2.2,但我也想开始将面向批处理的工作移入流式范例。

如果没有Spark 2.3,我是否缺少什么重要的东西?或者仅仅是结构化流变为“正式”版本而不是试验版本?

1 个答案:

答案 0 :(得分:0)

我能够在本地聚会上与某个“有识之士”交谈,他的回答(稍作记录)是您可以在2.2版中使用结构化流式传输,但是如果您对这种情况感到惊讶,如果您尝试在生产环境中使用,结果将不那么稳定(例如,越野车)。

他进一步建议,即使Spark 2.3在某些情况下,某些边缘情况也很容易引起问题,并且在此过程中进行了大量修复,应使其对于2.4更加稳定。所以给我自己的提示是,我应该尝试在生产环境中使用它,直到我的其他各种依赖关系允许使用Spark 2.4。可惜,因为我认为这种新方法非常邪恶。