卡桑德拉vs德鲁伊

时间:2016-12-31 20:16:41

标签: cassandra druid

我有一个用例,我必须使用Apache Spark分析实时数据。但我仍然对为我的应用程序选择数据存储感到困惑。分析主要包括汇总,基于KPI的身份分析和机器学习工具,以预测趋势和分析。 Cassandra得到了很好的支持,大型​​科技公司已经在生产中使用它。但经过研究,我发现德鲁伊比卡桑德拉更快,并且对OLAP查询有好处,但它的结果与Count Distinct这样的查询不一致。

任何与此相关的帮助都将受到赞赏。感谢

1 个答案:

答案 0 :(得分:1)

由于您的用例是分析实时数据,我建议您使用Druid而不是Apache Cassandra。对于Apache Cassandra,由于其异步主副本较少复制,您可能在实时分析中错过了更新的数据。另一方面,Druid是专为实时分析而设计的。

Druid详情:http://druid.io/druid.html
Apache Cassandra详细信息:https://en.wikipedia.org/wiki/Apache_Cassandra