多重参考的数据类型是什么?

时间:2019-02-11 20:44:48

标签: php mysql database performance pdo

我需要最快的性能方式来检索需要快速提升的整数。这是我的用例:我的网站上有一个“排序/过滤器”选项。我有狗的属性,例如长发,短发,大狗等。我希望用户能够按狗的属性进行过滤。

这是我的桌子:

dogs
- id
- attributes

这里是关于狗的属性的引用(对这个问题不是很重要,只是给你一个主意):

0 = adoptable pet
1 = short hair
2 = long hair
3 = fluffy
4 = black
5 = brown
6 = white
7 = golden/yellow
8 = etc...

现在,我具有以TEXT数据类型保存为JSON格式的属性。例如,["0","4"]["0"]["2"]

所以我想选择所有属性,如下所示:

SELECT * FROM dogs WHERE attributes LIKE %0% OR attributes LIKE %1% OR attributes LIKE %4% attributes LIKE %7%

如何选择属性包含0或1或4或7(非和)的所有行。如果某行具有这些属性之一,请选择它们。

处理它的最佳方法是什么?我应该将JSON数据类型存储在MySQL中还是应该做其他事情?我希望能够SELECT并将其快速拉起。我觉得LIKE的使用方式不会很快。

最好的和最快的方法是什么,尤其是成千上万行到数百万行?

谢谢你!

1 个答案:

答案 0 :(得分:3)

用逗号分隔的列表是一个有问题的反模式。 (Bill Karwin在他的《 SQL AntiPatterns:避免数据库编程的陷阱》一书中作了精彩的演讲,因此,我不会深入讨论为什么我们希望避免这种情况。相反,我将跳入一个经过验证的通常用于实现多值属性的模式。)


规范关系模式将创建一个在每行上具有单个属性的表。例如这样的东西:

CREATE TABLE dog_attribute 
( dog_id  int not null comment 'fk ref dog.id'
, attr    int not null comment '1=adoptable, 2=...'
, PRIMARY KEY (dog_id, attr) 
, CONSTRAINT FK_dog_attribute_dog FOREIGN KEY dog_id REFERENCES dog (id)
  ON UPDATE CASCADE ON DELETE CASCADE
, UNIQUE KEY dog_attribute_UX (attr, dog_id)
);

-

要为给定的dog_id添加三个属性,我们添加三行:

INSERT INTO dog_attibute (dog_id, attr) VALUES
 (1,2)
,(1,3)
,(1,5)

-

有几种可能的查询模式。举几个简单的例子:

要查找同时具有属性2和属性3的dog_id,我们可以这样做:

SELECT da.dog_id 
  FROM dog_attribute da
 WHERE da.attr IN (2,3) 
 GROUP
    BY da.dog_id 
HAVING COUNT(1) = 2 

还有其他查询模式可以给出相同的结果,例如

SELECT da.dog_id 
  FROM dog_attribute da
  JOIN dog_attribute dd
    ON dd.dog_id = da.dog_id 
   AND dd.attr = 3
 WHERE da.attr = 2

可以扩展第一个查询模式,以查找具有至少一组给定属性的dog_id。例如

 WHERE da.attr IN (2,3,5,7)

HAVING COUNT(1) >= 2

第二个查询可以扩展为单个属性添加联接和反联接

-

要查找具有属性2,具有属性3和4之一(或两者都有)而又没有属性7或8的行,我们可以执行以下操作:

SELECT da.dog_id 
  FROM dog_attribute da
  LEFT
  JOIN dog_attribute dn 
    ON dn.dog_id = da.dog_id 
   AND dn.attr IN (7,8) 
 WHERE dn.dog_id IS NULL 
   AND da.attr = 2
   AND EXISTS ( SELECT 1 
                  FROM dog_attribute de
                 WHERE de.dog_id = da.dog_id 
                   AND de.attr IN (3,4)
              )

(通过反联接排除具有属性7的dog_id ...)


如果我不能实现上面演示的表模式,...如果我绝对必须使用逗号分隔的列表,以将多个属性保存在单个列中...则需要一个小的静态属性集(在表定义,而不是动态添加或删除),我将使用MySQL SET数据类型。

https://dev.mysql.com/doc/refman/8.0/en/set.html

 attributes  SET('','adoptable','short hair','long hair','fluffy','black','brown','white','golden')

并对此进行查询,我们可以这样做:

WHERE FIND_IN_SET('black',t.attributes)
  AND FIND_IN_SET('long hair',t.attributes)