检测重复的标签

时间:2011-04-28 18:54:33

标签: php sql tags

我有一个网站,允许用户在提交之前公开标记他们的项目,类似于delicious.com所做的:

  

...用户可以标记每个书签   自由选择索引条款......

我想检测类似的拼写错误和标签,或者可能属于同一组。

例如,如果某人标记为阿森纳足球俱乐部,这与阿森纳足球俱乐部,阿森纳,勇士和/或枪手相同。我想看看哪个标签使用最多,然后将其更改为/或创建一个包含所有这些标签的组,就像阿森纳FC一样。

我对使用http://www.freebase.com/ API或http://www.elasticsearch.org/感兴趣,但这些似乎有些过分。我也知道一些名为http://en.wikipedia.org/wiki/Collective_intelligence的东西。

哦,我正在使用PHP和MySQL。

我的表格结构如下:

Item, Item_Tags, Tag

基本上我是一个懒惰的程序员,有人已经做过这样的事情,我可以只复制修改我的代码吗?

你的建议是什么?

1 个答案:

答案 0 :(得分:1)

也许您可以使用MySQL SOUNDS LIKE搜索:

SELECT id, tag FROM tags WHERE tag SOUNDS LIKE 'Shaw'

这也会给你一个像'Saw'这样的标签。