hadoop - cassandra数据库上的Hadoop

如果你有兴趣与Hadoop和Cassandra结婚 - 第一个链接应该是DataStax公司围绕这个概念建立的。 http://www.datastax.com/ 他们建立并支持hadoop，HDFS替换为cassandra。据我所知 - 他们确实有数据位置：http://blog.octo.com/en/introduction-to-datastax-brisk-an-hadoop-and-cassandra-distribution/

关于Hadoop＆amp; amp;答案很好如果您对cassandra运行MapReduce，则为Cassandra数据位置 Cassandra and MapReduce - minimal setup requirements

关于你的问题 - 有一个交易： a）如果您在单独的节点上运行Hadoop / Hive，则会丢失数据位置，因此您的数据吞吐量会受到网络带宽的限制。
b）如果你在与cassandra运行相同的节点上运行hadoop / Hive - 你可以获得数据位置，但是hive查询后面的MapReduce处理可能会阻塞你的网络（和其他资源），从而影响你从cassandra的服务质量。

如果你的cassandra集群的性能至关重要，我的建议是拥有单独的配置单元节点。
如果你的cassandra主要用作数据存储而不处理实时请求 - 那么在每个节点上运行配置单元将提高性能和硬件利用率。

cassandra数据库上的Hadoop

1 个答案: