为Hbase Table创建拆分的策略。

时间:2017-06-08 12:20:36

标签: hbase

   Can any one suggest me strategies while splitting HBASE table. I have data range starts from [a-z]. 

我把它分æˆäº†{“eâ€ï¼Œâ€œjâ€ï¼Œâ€œoâ€ï¼Œâ€œuâ€}。这会是有效的方å¼ã€‚

1 个答案:

答案 0 :(得分:0)

您如何分割数æ®ï¼Ÿ

拆分表时,需è¦é¿å…热点。例如,å¯ä»¥é€šè¿‡è…Œåˆ¶æ¥é˜²æ­¢è¿™ç§æƒ…况。如果您的行å‡åŒ€åˆ†å¸ƒï¼Œé‚£ä¹ˆæ‚¨çš„拆分就å¯ä»¥äº†ã€‚

但如果您ä¸æŽ§åˆ¶æ•°æ®ï¼Œæœ€å¥½å°†salting应用于行键。

我将从HBase documentation

给您举例

如果你有这样的行:

foo001
foo002
foo003
foo004

然åŽä½ çš„所有行将进入相åŒçš„分割,这将导致热点。

如果您在行的开头添加一个éšæœºå­—符串,例如“eâ€ï¼Œâ€œjâ€ï¼Œâ€œoâ€æˆ–“uâ€ï¼Œé‚£ä¹ˆæ­£åœ¨è¿›è¡Œè…Œåˆ¶éžå¸¸é‡è¦ï¼Œé‚£ä¹ˆæ‚¨å°†å‡åŒ€åœ°åˆ†å‘æ•°æ®

e-foo002
u-foo003

您的数æ®å°†æ›´å‡åŒ€åœ°åˆ†å¸ƒã€‚ä½ å¯ä»¥åº”用éšæœºæˆ–决定论腌制,这å–决于你,但一个决定论者更好,因为éšæœºå¯èƒ½ä¼šå¯¼è‡´è…Œåˆ¶çš„棘手问题。

作为(éžå¸¸ï¼‰å¿«é€Ÿçš„结论:如果你有å‡åŒ€åˆ†å¸ƒçš„æ•°æ®ï¼Œä½ çš„分裂很好,å¦åˆ™æœ€å¥½åº”用salting

编辑:在SO的文档中解释这个å¯èƒ½æ˜¯ä¸ªå¥½ä¸»æ„。

相关问题