关于在机器学习场景中对用户进行分类的建议

时间:2016-12-11 23:53:55

标签: machine-learning artificial-intelligence classification user-input

我正在寻找一些关于根据注册流程的答案将用户分类到不同群组的问题的建议。

这个想法是这些分类将对具有相似旅行习惯的人进行分组,即冒险,放松,美食等。这不应该是用户已知的分类,因此不仅仅是要求他们喜欢什么样的假期(重点是消除用户偏见/不知道自己放在哪里)。

我看到它工作的方式是询问诸如他们使用的应用程序,他们在社交媒体上进行交互的帐户(gopro,餐馆等)等问题,提供一些场景并询问哪种听起来最好,这些将从提供的一组中选择它们,因此我们可以控制变量。我遇到的主要问题是如何获得与其中每一个相关的数值。

我已经研究过各种机器学习算法,并且已经意识到这很可能是一个聚类问题,但我似乎无法弄清楚如何使用这种问题来为每个维度分配一个实际给出的值有用的分类。

我遇到的另一个问题是,是否有一些资源可以让我找到有关问题类型的信息,要求用户获取允许这样分类的信息。

如果有人熟悉,我设想的那种过程类似于https://www.thread.com/signup/introduction

欢迎任何建议。

2 个答案:

答案 0 :(得分:0)

您手头的问题是您想要根据分类变量计算相似性度量,这是他们的应用程序,帐户等的选择。除非您测量这些应用程序相对于属性的相似性,例如如何美食家是应用程序,这将是一个难以指定的问题。此外,您需要知道分类变量可以假设的所有可能状态,以创建这样的相似性度量。 如果最终目标是推荐类似的人(基于应用程序选择或社交媒体帐户选择)喜欢或喜欢的东西,您应该考虑协作过滤。 如果您的功能空间定义明确且是静态的(已知应用程序,已知帐户,有限设置且缺少值),那么请查看基于内容的推荐系统,像Market Basket Analysis这样简单的东西可以为您提供合理的工作模型。 另外,如果你真的想用一系列可以假设随机状态的特征对系统进行建模,可以用多变量概率模型来完成,如果结构(特征之间的关系和影响)得到很好的定义,你可以从概率图形模型中受益,如贝叶斯网络。 在开始解决问题之前,你确实需要更好地定义问题。

答案 1 :(得分:0)

您可以使用素数。如果所有可能选项列表中的每个选项都分配了不同的素数,并且用户的选择被保存为产品,那么如果选择/选择的模数,您将始终知道用户是否做出了特定的选择是素数的美,瞧!

相关问题