小部件订单的聚类算法

时间:2016-01-15 16:47:54

标签: python machine-learning scikit-learn unsupervised-learning

我的表包含多个部门的窗口小部件订单,每个部门由其买方代表。表结构如下所示:

+--------------------------+------------+------------+------------+
|         order_id         | order_date | dept_buyer | widget_mfg |
+--------------------------+------------+------------+------------+
| 56991ba89468d0fc1d53781d | 2/16/2015  | Gutierrez  | OTHERSIDE  |
| 56991ba8f020fc065e5b7219 | 11/14/2014 | Moreno     | QUALITEX   |
| 56991ba82340ecb7b2e9dda8 | 1/15/2015  | Gutierrez  | PROGENEX   |
| 56991ba87bacb0ee3161fd61 | 2/4/2015   | Glover     | ULTRASURE  |
| 56991ba8ade6acae3307a3e9 | 4/20/2015  | Hancock    | WEBIOTIC   |
| 56991ba80b404bcc73094e66 | 4/3/2014   | Castro     | PROGENEX   |
| 56991ba8cb37eda5e5557a74 | 7/21/2014  | Moreno     | OTHERSIDE  |
+--------------------------+------------+------------+------------+

每行代表一个小部件顺序,因为小部件通常是单独订购的。实际的表有数万行代表约3年的订单。有大约100个部门买家,~1000个小部件制造商。

我想为部门买家提供一个订单,其中包含最常订购的小部件,以便于购买。从以前的经验来看,我知道许多部门买家订购了类似的小部件。也就是说,部门买家可以通过他们的小部件购买行为聚集在一起。出于这个原因,以及出于维护目的,我想尽可能少地创建表单,同时仍然为将使用该表单的部门买家捕获最常订购的小部件。

这对我来说似乎是一个机器学习集群问题,但我对主题领域不够熟悉,无法立即解决问题。是否有已建立的算法或库来解决像这样的问题?

0 个答案:

没有答案