apache-spark - Spark应用程序即服务

Spark并非设计为这样运行；除了内置的HistoryServer和Worker UI外，它没有REST API服务器框架。

如果您想要长时间运行的Spark动作，则可以使用Spark Streaming并通过原始套接字，Kafka等（而不是HTTP方法）向其发出动作

好的问题，让我们逐步讨论

i）如果您只有10万个数据，那么您真的不需要Apache Spark强大的Java应用程序，可以很好地快速返回响应。

ii）如果您有PB级数据，则由于Apache Spark不支持索引，因此无法以数据集或数据帧的形式加载到内存中，因为Spark不是数据管理系统，而是快速批处理数据引擎，因此Gemfire可以灵活地添加索引以快速检索数据。

解决方法：

所以为什么不使用spark.close（）而不将Sparing应用程序与Apache Spark一起使用。

作为微服务的Spring应用程序，您需要在容器或PCF / Bluemix / AWS / Azure / GCP等上的其他服务，而Apache Spark具有自己的世界，需要PCF上没有的计算能力。
Spark不是数据库，因此它不能“存储数据”。它处理数据并将其临时存储在内存中，但这不是持久存储。
一旦提交Spark作业，您将不得不等待两次之间的结果，而您无法获取数据。

如何将Spring的Spark应用程序用作Rest API调用：

Apache Livy是一项服务，可通过REST接口轻松与Spark集群进行交互。它可以通过简单的REST接口或RPC客户端库轻松提交Spark作业或Spark代码片段，同步或异步结果检索以及Spark上下文管理。