搜索多种语言 - 如何?

时间:2016-11-21 15:26:04

标签: search multilingual relevance

TLDR:我想在我的网站ala Pinterest上构建多语言搜索,我该怎么做?

我正在创建一个网站,人们可以在其中发布获取用户输入的元数据的内容。然后,人们可以通过查看内容,喜欢它,评论它,将其分享到社交媒体来与内容进行交互。内容发现主要通过搜索完成。

我不希望在我的网站上创建地理边界。我希望说任何语言的人能够找到任何语言与他们相关的内容。这个要求是有道理的,因为内容是高度可视化的,Plarest。所以,即使我不明白在描述中用“法语”这个词写的,也没关系,因为我最感兴趣的是看车。

Pinterest对于跨语言搜索真的很棒。例如,在uk.pinterest.com上I typed "coupe carrée" which is the French for "bob haircut" and all the results are visually relevant.即使引脚元数据是英文的,原始网站都是英文的。

怎么可能? Pinterest如何能够匹配我的法语搜索查询内容,其中的文字全部为英文?在某个步骤有翻译:coupecarrée> bob haircut>内容包含“bob haircut”?

我查看了他们的工程博客,我找到的只是技术来检测网站的原始国家和语言。没有关于在搜索中管理语言的事情。

请告诉我这是否是错误的地方,询问它是如何运作的问题。

预先感谢你能分享的任何帮助/指针!

1 个答案:

答案 0 :(得分:0)

此案例中的一般策略是使用您要搜索的每种语言翻译索引您的内容。

这需要在索引时使用language translation API。和语言识别模型。 Here's a Solr example