MySQL中的复合主键性能缺陷

时间:2009-09-22 14:35:00

标签: mysql performance primary-key composite-key

我们有一个包含三个字段的复合主键的表(它在MySQL 5.1中)。此表上每秒有近200个插入和200个选择,表的大小约为100万行,并且正在增加。

我的问题是:“复合主键”是否会降低此表上的插入和选择的性能?

我应该使用简单的自动增加INT ID字段而不是复合主键吗? (我认为答案与MySQL处理多列索引的方式非常相关)

3 个答案:

答案 0 :(得分:53)

INSERTUPDATE表现差别不大:(INT)(INT, INT)键几乎相同。

复合SELECT

PRIMARY KEY效果取决于很多因素。

如果您的表格为InnoDB,则该表格会隐式聚类在PRIMARY KEY值上。

这意味着如果两个值都包含密钥,则搜索这两个值的速度会更快:不需要额外的密钥查找。

假设您的查询是这样的:

SELECT  *
FROM    mytable
WHERE   col1 = @value1
        AND col2 = @value2

表格布局如下:

CREATE TABLE mytable (
        col1 INT NOT NULL,
        col2 INT NOT NULL,
        data VARCHAR(200) NOT NULL,
        PRIMARY KEY pk_mytable (col1, col2)
) ENGINE=InnoDB

,引擎只需要在表格中查找确切的键值。

如果您使用自动增量字段作为假id:

CREATE TABLE mytable (
        id INT NOT NULL AUTO_INCREMENT PRIMARY KEY,
        col1 INT NOT NULL,
        col2 INT NOT NULL,
        data VARCHAR(200) NOT NULL,
        UNIQUE KEY ix_mytable_col1_col2 (col1, col2)
) ENGINE=InnoDB

,然后引擎首先需要在索引(col1, col2)中查找ix_mytable_col1_col2的值,从索引中检索行指针(id的值)并制作另一个id在表格中查找。

对于MyISAM表,这没有区别,因为MyISAM表是堆组织的,而行指针只是文件偏移量。

在这两种情况下,都会创建相同的索引(PRIMARY KEYUNIQUE KEY),并且将以相同的方式使用。

答案 1 :(得分:22)

如果是InnoDB,复合主键将包含在每个二级索引的每个条目中。

这意味着

  • 您的二级索引占用的空间与主键
  • 中的所有列一样多
  • 如果所需的所有列都包含在辅助索引中,则可以使用辅助索引作为覆盖索引+ pk

这些当然分别是一个缺点和优势。

复合主键不一定是坏的,有时它们真的很有用,因为InnoDB将它们聚集在一起 - 这意味着使用远远少于非需要的IO操作可以满足PK上的(光盘限制)范围扫描。 - 聚集索引。

当然,如果你在其他表中有外键,它们会更宽,而且需要包含主表中的全部键。

但总的来说,我会说平衡。拥有复合主键本身不会导致问题。但是,拥有“大”主键(例如大变量)可能会超过群集的优势并且能够使用覆盖索引。

答案 2 :(得分:3)

  1. 让复合主键慢慢减慢SELECT,但效果几乎可以忽略不计,不值得担心。
  2. 将这些列完全的列放慢了INSERT的速度,你肯定做了足够的INSERT来担心它。如果它是一个MyISAM表,而INSERT锁定表,那么这比它是一个InnoDB表更令人担忧。如果通过使用auto_increment主键,您可以将这些列保留为未编制索引,那么您将从更改中受益。但是,如果你仍然需要保留这三列的索引(例如,如果你需要对它们的组合强制执行唯一性),那么在性能方面它不会为你做任何事情。