mongoDB上的数据流分析策略

时间:2015-09-13 18:25:32

标签: python mongodb architecture analytics spark-streaming

我对大数据世界很陌生,经过几个小时的阅读和记录,我决定寻求你的建议。这是合约:

我需要对来自mongoDB 集合的数据执行实时分析。我的分析器必须用解释语言编写(最好用 Python )。

根据我的阅读, spark-streaming 看起来就像一见钟情的完美工具。但至少在Python中,根据doc从mongoDB创建输入DStream似乎是不可能的。有没有其他选择,比如使用Apache Kafka将数据从mongoDB传递到spark?或者我应该尝试像Apache风暴这样的其他框架吗?

我对所有这些对我来说都是新的技术有点迷失。您将使用哪些框架来实现此分析器?

0 个答案:

没有答案