你如何处理天文数据高的数据库ID

时间:2012-09-13 05:15:56

标签: mysql sql database sharding

这个问题与我曾经遇到过的问题无关,但它让我夜不能寐。从理论上讲,最终,随着表格中行数的增加和上升,每行对应的ID将“用完”数字,不是吗?我想如果你继续增加列值的深度,你可以保持它上升,但最终必须有一个上限,对吗?

我听说过一种叫做“分片”的技术,但没有详细解释,以满足我的好奇心。答案是你只是不断添加更多数字,或者是否有一个聪明的模式允许在他们自己的沙箱中“重复”ID。如果这些沙箱必须互动怎么办?

2 个答案:

答案 0 :(得分:5)

Sharding与ID的大小无关。

处理它的正确方法是:不要担心。

32位int具有足够的值,您可以在100多年内每秒添加一行而不会耗尽。

如果这还不够,使用64位int,你可以每秒添加1 十亿行,并且仍然可以持续超过500年。

所以基本上:不要担心。根据您期望的行数100选择int的大小,然后继续。

重新分片:

这只是一种通过使用规则来决定哪个服务器应该获取数据来将数据库拆分到多个服务器上的方法。规则取决于您存储的内容和您拥有的服务器数量。

答案 1 :(得分:2)

来自dev.mysql.com

  

为AUTO_INCREMENT列使用足够大的整数数据类型来保存所需的最大序列值。当列达到数据类型的上限时,下一次生成序列号的尝试将失败。例如,如果使用TINYINT,则允许的最大序列号为127.对于TINYINT UNSIGNED,最大值为255.

这实在令人着迷。我想一个简单的(半)答案是使用BIGINT - 最大值为18,446,744,073,709,551,615。如果你得到那么多列 - 那么...哇......