新闻排名算法?

时间:2012-09-11 04:17:19

标签: algorithm ranking

现在。我建立了一个新闻公式,以获取列表热点新闻。 有任何因素作为网页浏览,时间,内容。 这个问题的解决方案是什么? 感谢

1 个答案:

答案 0 :(得分:3)

您可以针对此问题尝试machine learning方法。

  1. 提取您的功能,并为每个功能提供一个数值(您可以使用 内容Bag of Words model。请注意,可能需要一些feature selection算法。
  2. 手动标记足够多的示例 - 并根据其重要性为每个示例分配一个分数。
  3. 使用linear regression并构建一个评估每篇文章并为其提供分数的函数。
  4. 现在您已经拥有了回归功能,您可以使用它来为每篇文章分数。用它来获得原始分数。
  5. 对于后期处理 - 将此分数与第二个函数中的时间相结合,以获得文章的最终分数。 @MattBall's suggested link似乎是合理的做法。
相关问题