cassandra - Cassandra：时间序列数据和二级索引 - Thinbug

Cassandra：时间序列数据和二级索引

时间：2015-01-05 20:01:00

标签： cassandra

假设我有100 K个用户遍布10 K个城镇/地区。我是recv时间序列数据，他们说每5分钟（对于每个用户）我没有城镇作为关键的一部分。

在这种情况下，在城镇创建二级索引是一种好习惯。

问候

1 个答案:

答案 0 :(得分：3)

对于二级索引，10,000个不同的密钥绝对不是理想的情况，因为这将是一个非常高的基数。我建议阅读Richard Low关于'The sweet spot for Cassandra secondary indexing'的文章。读取性能可能不太理想，因为索引扫描需要在每个分区的副本上进行。

在你的情况下，我建议通过创建一个名为'users_by_town'的单独表来进行非规范化，这个表允许你按城镇搜索用户。

您可以随时尝试这两种情况，并使用request tracing了解此特定情况下二级索引的成本。