功能是否可能成为群集算法的列表?

时间:2011-06-20 13:48:02

标签: machine-learning

这是我的用例:

我有网络资源,每个资源都有一组视图。它来自网络导航,所以您访问的资源和实际访问的视图。

对于每个视图,我都有关于位置,查看日期的时间的信息,我可以获得有关视图总数和在此资源上传递的时间等信息。

我想在此信息中找到不同的模式,以确定用户配置文件。如果,对于每个资源,我只有一个视图,可以很容易地对它们进行聚类,但是由于我有很多视图,有没有办法可以使用这些信息来更好地聚类资源?

2 个答案:

答案 0 :(得分:1)

如果我理解正确,您希望根据他们拥有的视图对资源进行聚类。为此,您可能希望根据视图的统计信息制作特征向量。例如,您的特征向量可以包括:视图总数,观看者位置的标准变量,平均观看时间,资源年龄等。然后,您可以将这些特征向量提供给聚类算法。您要使用的确切功能取决于您对群集的使用。如果您希望群集反映资源的内容且资源是基于文本的,那么我建议您也使用bag of words

答案 1 :(得分:0)

很难说出你究竟在问什么。是的,feature vectors广泛用于机器学习算法。