按多个标记过滤帖子,以返回包含所有这些标记的帖子,并获得良好的效果

时间:2010-03-01 23:58:49

标签: mysql couchdb nosql tagging join

StackOverflow允许您按标签搜索帖子,并允许您按标签的交集进行过滤,例如ruby x mysql x tags。但通常使用标记上的多个连接从MySQL检索此类列表效率很低。什么是一种更高效的方法来实现逐个多个标记查询?

这个问题是否有一个很好的NoSQL方法?

1 个答案:

答案 0 :(得分:2)

在NoSQL或面向文档的场景中,您将实际标记作为文档的一部分,可能存储为列表。由于您已使用“couchdb”标记了此问题,因此我将以此为例。

CouchDB中的“post”文档可能如下所示:

{
   "_id": <generated>,
   "question": "Question?",
   "answers": [... list of answers ...],
   "tags": ["mysql", "tagging", "joins", "nosql", "couchdb"]
}

然后,生成一个由标签键入的视图:

{
   "_id": "_design/tags",
   "language": "javascript",
   "views": {
      "all": {
         "map": "function(doc) {
            emit(doc.tags, null);
         }"
      }
   }
}

在CouchDB中,如果您愿意,可以使用多个密钥发出HTTP POST。一个例子是the documentation。使用该技术,您将能够通过多个标签进行搜索。

注意:将值设置为null,有助于保持视图较小。如果您还想查看实际文档,请在查询中使用include_docs=true