为什么Cassandra从磁盘读取的数据多于所需的数据?

时间:2019-03-13 18:30:00

标签: performance cassandra luks

我们在AWS中的i3.2xl实例集群上运行Cassandra 3.0.16。使用Luks对存储数据的卷进行加密。我们正在运行一项工作,该工作需要通过在单个记录键上运行单个查询来从两个表中读取3TB数据。如果我们查看其中一个Cassandra实例的Cloudwatch IO指标,则看起来Cassandra将在作业完成之前读取1000 TB的数据。这导致作业时间比预期慢6倍。

我们已完全压缩了正在读取的两个表,它仅使性能提高了10%。我们通过在未加密卷的群集上看到相同的慢速性能来排除导致速度慢的加密。

是否可以调整任何Cassandra配置设置以减少过多的IO?

0 个答案:

没有答案