Estimation of data volume

时间:2016-02-12 20:01:19

标签: cassandra cassandra-stress

I have a Cassandra cluster with 3 nodes which has data from 3 applications. Now, we are planning to add 3 news applications that will increase the workload on the cluster, I want to know the different steps to know the future projection like, if we will add another node etc ... Is it possible to use Cassandra-stress to do that ? If yes, what elements I will look for ?

Thank you for your advice.

2 个答案:

答案 0 :(得分:1)

对于3节点群集,如果要添加3个应用程序以及当前3个应用程序,请确保群集能够承担负载。您应该知道每个应用程序在高峰时间的读写量。基于读写,使用Cassandra-Stress工具对集群进行基准测试。我建议为新应用程序使用不同的集群。

答案 1 :(得分:1)

cassandra-stress工具确实可用于建模您预期的应用程序,以便您可以编写数据并查看群集的扩展方式。您应该 - 出于显而易见的原因 - 针对类似于您的硬件的类似大小的群集运行,而不是在您的实时生产群集上运行(cassandra-stress将增加吞吐量,直到群集发生故障,这就是压力点效用)。您还可以编写一个测试,将与您的应用程序匹配的数据缓慢插入数据库,然后执行nodetool flush将数据强制插入sstables,然后计算负载变化以确定应该为每个应用程序设置多少字节数期望,并在传统的容量估算计算中使用它。