design-patterns - 识别两个数据集之间匹配百分比的方法

在确定解决此问题的适当方法时，我需要指导：

我有100个人购买产品A，B，C的清单。每个人都有个人资料，例如年龄，性别。因此，列表为：[24，F，A]，[25，M，B]，[23，F，A]，[23，F，A]，[24，F，A]，[24，M， C]... 现在，第11个人例如在系统中购买产品。 C.他的性别为F，年龄为24（[24，F，C]）。

我想向人们展示，有多少个人与他/她的个人资料完全匹配，并且购买了商品C。

我应该采用哪种方法？解决方案1我尝试过将数据存储在excel / csv中，并使用Weka Java API在Java程序中使用Apriori算法查找关联规则。但它显示了所有可能组合的关联规则。即（24-> A），（A-> 24），（24，F）-> A，（A，24）-> E..etc及其支持度和置信度值。相反，我只想要规则（24，F）-> A及其信任和支持。因此，基本上我不知道如何使用Weka Java API过滤特定规则。

这是我找到的一种方法，但是不知道是否合适，或者是否存在其他方法来查找此问题中的匹配项？

识别两个数据集之间匹配百分比的方法

0 个答案: