Cassandra:时间序列数据和二级索引

时间:2015-01-05 20:01:00

标签: cassandra

假设我有100 K个用户遍布10 K个城镇/地区。我是recv时间序列数据,他们说每5分钟(对于每个用户) 我没有城镇作为关键的一部分。

在这种情况下,在城镇创建二级索引是一种好习惯。

问候

1 个答案:

答案 0 :(得分:3)

对于二级索引,10,000个不同的密钥绝对不是理想的情况,因为这将是一个非常高的基数。我建议阅读Richard Low关于'The sweet spot for Cassandra secondary indexing'的文章。读取性能可能不太理想,因为索引扫描需要在每个分区的副本上进行。

在你的情况下,我建议通过创建一个名为'users_by_town'的单独表来进行非规范化,这个表允许你按城镇搜索用户。

您可以随时尝试这两种情况,并使用request tracing了解此特定情况下二级索引的成本。