有人能指出我的内容相关性算法吗?

时间:2010-10-22 12:12:04

标签: algorithm full-text-search match relevance

我的桌面上出现了一个有一些有趣要求的新项目。我需要开发一个可搜索的企业目录,重点是根据任意搜索查询提供相关结果。这些企业可以是任何利基市场;没有一个区域比另一个区域更具代表性。

当谷歌搜索“搜索算法”或“内容相关性算法”之类的内容时,我得到的只是Google的“老神的神秘算法”和SEO公司。

MySQL的全文Match()函数的相关性值是否具有该任务所需的内容?我从来没有用过它,但我肯定会做一些测试。此外,由于这将主要是人工编辑的目录,我可以假设我们可以添加标记和类别等加权因子。将这些因素与MySQL Match()相关性结合起来的好方法是什么?

我也很乐意接受我在这里没有讨论的想法。

3 个答案:

答案 0 :(得分:2)

有关基于信息检索的技术查找示例TF-IDFBM25

对于基于机器学习的技术,请从MSR中查找RankNet及其变体。

答案 1 :(得分:1)

如果您手动编辑了数据,请查看Oracle text search。在我之前的一个项目中,我们取得了一些不错的成绩。

我没有直接参与数据库设置,但我知道结果非常受欢迎。 (在此之前,他们只有基于关键字的搜索)。

答案 2 :(得分:0)

使用Solr之类的搜索引擎来索引数据。您仍然可以使用MySql来保存数据,但搜索使用搜索引擎。

相关问题