HBase行键设计:热点与参考局部性

时间:2017-10-11 15:58:19

标签: key hbase localityofreference

考虑一个假设的HBase表。

  • 密钥必须编码0到1000之间的3元组(k, m, n)
  • 典型的阅读是对mn的范围查询,修正了k的值。
  • 相对于k,读取负载为exponentially distributed。换句话说,k的一些值负责大部分读取负载。

Alice认为密钥应该看起来像"k-m-n",以便利用引用的局部性。理想情况下,一台机器应该能够提供整个查询。

Bob认为密钥看起来应该像"sha1(k-m)-n",以避免hotspotting:如果k=1被非常频繁地访问,那么对于所有k=1来说都是明智的记录到都在同一台机器上。

这两个论点对我都有意义。如何确定哪个选项更具可扩展性/面向未来?是否有一种快速,实用的方法来根据经验进行测试?

0 个答案:

没有答案