mysql - SQL查询LIKE％索引

时间：2013-02-07 16:25:20

标签： mysql sql

我正在使用mysql数据库。我的网站有不同的元素（PRJ_12用于projet 12，TSK_14用于任务14，DOC_18用于文档18等）。我们目前将对这些元素的引用作为VARCHAR存储在我们的数据库中。关系列是索引的，因此选择速度更快。

我们正在考虑将这些列分为2列（使用PRJ的列“element_type”和使用12的“element_id”列）。我们正在考虑这个解决方案，因为我们做了很多包含LIKE ...％的请求（例如检索一个用户的所有任务，无论任务的id）。但是，将这些列拆分为2将增加索引列的数量。

所以，我有两个问题：

索引列中的LIKE ...%请求真的比简单查询（不喜欢）更慢。我知道如果列未编入索引，则不建议执行where ... LIKE %个请求，但我不知道索引是如何工作的。）
我们将参考列拆分为两个的事实将使索引表的数量加倍。这是一个问题吗？

谢谢，

答案 0 :(得分：1)

1）喜欢总是比完全比较（使用=）更昂贵，但是这一切都归结为字段数据类型和记录数量（除非我们谈论的是一个巨大的表，你不应该有问题）

2）多列索引不是问题，是的，它使索引更大，但是那又是什么？数据类型和总行数很重要，但这就是索引的用途。

所以去吧

答案 1 :(得分：0)

涉及到许多因素，但一般来说，在只有一个索引的表上再添加一个索引不太可能是一个大问题。有些事情需要考虑。

如果表最主要是只读，那么几乎肯定不是问题。如果更新很少，则不需要经常修改索引，这意味着除了额外的磁盘空间外，将会有很少的额外成本。
如果对现有记录的更新不会更改这些键值中的任何一个，则不需要修改索引，因此不会有额外的运行时成本。
DELETES和INSERTS需要更新两个索引。因此，如果这是大多数操作（并且远远超过读取），那么额外的索引可能会导致可测量的性能下降（但从人的角度来看可能不是很多而且不明显）。
应该完全优化描述用法的类似运算符。换句话说，如果在两种情况下都存在索引，则子句WHERE combinedfield LIKE 'PRJ%'应该与WHERE element_type = 'PRJ'基本相同。更昂贵的情况是，如果您在开头使用外卡（例如，LIKE '%abc%'）。您可以将LIKE搜索视为等同于在字典中查找单词。搜索'overf％'与搜索'溢出'基本相同。您可以在字典中进行“手动”二进制搜索，并快速找到以“overf”开头的第一个单词。搜索'％low'虽然要贵得多。您必须扫描整个字典才能找到以“low”结尾的所有单词。
从长远来看，有两个单独的字段来表示两个单独的值几乎总是更好，因为您可以构建更有效的查询，轻松执行连接等。

因此，基于给定的信息，我建议将其拆分为两个字段并索引两个字段。