卡桑德拉删除最佳实践

时间:2015-07-16 16:47:48

标签: cassandra-2.0

我们有实时数据进入我们的系统。我们有在线查询,我们需要提供服务。为了提供这些在线查询,我们需要对数据进行一些预处理,以便我们能够更快地提供服务。 现在我的查询是如何预处理在线实时数据。应该有办法让我弄清楚数据是否已经处理过。为了找到这种差异,我有以下方法:

  • 我可以有一个标记表示数据已处理或未处理,根据该标记我可以进一步决定是否处理
  • 我可以有一个列系列,我可以在其中插入带有TTL 的数据,以及像kafka这样的消息总线中的主题,它为我提供cassandra中的行标识符,以便我可以处理此行在cassandra
  • 我每天可以有一个列族,并且像kafka这样的消息总线中有一个主题,它为我提供了相应列族的行标识符
  • 我每天可以有一个密钥空间,并且像kafka这样的消息总线中有一个主题,它为我提供了相应列族的行标识符

我读了一些内容,如果删除的数量增加,那么墓碑的数量会增加并导致查询时间变慢。现在我对上述四种选择方法感到困惑,还是有更好的方法来解决这个问题?

1 个答案:

答案 0 :(得分:0)

根据datastax博客第三个选项可能更适合。 Cassandra Anti-patterns