识别两个数据集之间匹配百分比的方法

时间:2018-12-06 07:16:47

标签: design-patterns matching

在确定解决此问题的适当方法时,我需要指导:

我有100个人购买产品A,B,C的清单。每个人都有个人资料,例如年龄,性别。 因此,列表为:[24,F,A],[25,M,B],[23,F,A],[23,F,A],[24,F,A],[24,M, C]... 现在,第11个人例如在系统中购买产品。 C.他的性别为F,年龄为24([24,F,C])。

我想向人们展示,有多少个人与他/她的个人资料完全匹配,并且购买了商品C。

我应该采用哪种方法? 解决方案1我尝试过将数据存储在excel / csv中,并使用Weka Java API在Java程序中使用Apriori算法查找关联规则。但它显示了所有可能组合的关联规则。即(24-> A),(A-> 24),(24,F)-> A,(A,24)-> E..etc及其支持度和置信度值。相反,我只想要规则(24,F)-> A及其信任和支持。因此,基本上我不知道如何使用Weka Java API过滤特定规则。

这是我找到的一种方法,但是不知道是否合适,或者是否存在其他方法来查找此问题中的匹配项?

0 个答案:

没有答案
相关问题