bigdata - 大数据延时查询

使用Redis内置的BITFIELD或SET功能是一种有效完成此操作的绝佳方法。基本上，您每天存储一个条目，其中包含该天的一组唯一标识符（在SET实现的情况下）或一个位字段，其中每个位置代表一个不同的Cookie ID（请注意，这些位置在时间上必须保持一致），如果您无法事先枚举ID（例如，流失率较高的Cookie ID），这将非常棘手）。

Avichal Garg @avichal在GetSpool.com上有一篇很棒的文章，其中他们针对这个确切的用例展示了出色的实时查询性能：

在模拟1.28亿用户的过程中，诸如“每日唯一用户”之类的典型指标在MacBook Pro上花费的时间少于50毫秒，而仅占用16 MB的内存。

请注意，此解决方案不仅可以让您计算唯一性，而且实际上可以告诉您确切的WHICH用户-并非以抽样或近似的HyperLogLog方式，而是以真实，完整和准确的用户列表告诉您方式。

在上一份工作中，我在生产中使用了相同的方法，我可以验证其结果。

大数据延时查询

1 个答案: