Can any one suggest me strategies while splitting HBASE table. I have data range starts from [a-z].
我把它分æˆäº†{“eâ€ï¼Œâ€œjâ€ï¼Œâ€œoâ€ï¼Œâ€œuâ€}。这会是有效的方å¼ã€‚
ç”案 0 :(得分:0)
您如何分割数æ®ï¼Ÿ
拆分表时,需è¦é¿å…çƒç‚¹ã€‚例如,å¯ä»¥é€šè¿‡è…Œåˆ¶æ¥é˜²æ¢è¿™ç§æƒ…况。如果您的行å‡åŒ€åˆ†å¸ƒï¼Œé‚£ä¹ˆæ‚¨çš„拆分就å¯ä»¥äº†ã€‚
但如果您ä¸æŽ§åˆ¶æ•°æ®ï¼Œæœ€å¥½å°†salting应用于行键。
我将从HBase documentation
ç»™æ‚¨ä¸¾ä¾‹å¦‚æžœä½ æœ‰è¿™æ ·çš„è¡Œï¼š
foo001
foo002
foo003
foo004
然åŽä½ 的所有行将进入相åŒçš„分割,这将导致çƒç‚¹ã€‚
å¦‚æžœæ‚¨åœ¨è¡Œçš„å¼€å¤´æ·»åŠ ä¸€ä¸ªéšæœºå—符串,例如“eâ€ï¼Œâ€œjâ€ï¼Œâ€œoâ€æˆ–“uâ€ï¼Œé‚£ä¹ˆæ£åœ¨è¿›è¡Œè…Œåˆ¶éžå¸¸é‡è¦ï¼Œé‚£ä¹ˆæ‚¨å°†å‡åŒ€åœ°åˆ†å‘æ•°æ®
e-foo002
u-foo003
您的数æ®å°†æ›´å‡åŒ€åœ°åˆ†å¸ƒã€‚ä½ å¯ä»¥åº”用éšæœºæˆ–决定论腌制,这å–å†³äºŽä½ ï¼Œä½†ä¸€ä¸ªå†³å®šè®ºè€…æ›´å¥½ï¼Œå› ä¸ºéšæœºå¯èƒ½ä¼šå¯¼è‡´è…Œåˆ¶çš„棘手问题。
作为(éžå¸¸ï¼‰å¿«é€Ÿçš„ç»“è®ºï¼šå¦‚æžœä½ æœ‰å‡åŒ€åˆ†å¸ƒçš„æ•°æ®ï¼Œä½ 的分裂很好,å¦åˆ™æœ€å¥½åº”用salting
编辑:在SO的文档ä¸è§£é‡Šè¿™ä¸ªå¯èƒ½æ˜¯ä¸ªå¥½ä¸»æ„。