狮身人面像新手 - 文本分析和搜索结果'相对论'

时间:2012-09-27 08:01:23

标签: sphinx

成为狮身人面像的新手,请原谅任何错误或误用的条款。

Sphinx正在基于网络的应用程序中使用,该应用程序包含数百万条记录的数据库,以便提供全文搜索功能。

对于存储在数据库中的英语内容,搜索结果是“准确的”且相对于搜索关键字。非拉丁字符也不会发生同样的事情。我查看了形态配置设置,但希腊语不作为选项提供。因此,对于希腊语关键字,搜索结果与搜索关键字并不总是与英语中的关键字相关。

对于希腊语内容,sphinx是否对英语内容执行相同的文本分析和索引?

任何信息(链接,评论,答案)都会有所帮助。

感谢,

1 个答案:

答案 0 :(得分:1)

这很可能受charset_type和charset_table配置的影响。

http://sphinxsearch.com/docs/current.html#conf-charset-type

http://sphinxsearch.com/docs/current.html#conf-charset-table

开箱即用sphinx只是真正设置为英语和俄语(主要的Sphinx开发人员恰好说的语言:)

因此,您需要启用utf8模式,并将所需的希腊字符添加到charset_table。

狮身人面像维基 http://sphinxsearch.com/wiki/doku.php?id=charset_tables 有一组希腊配置选项可以复制/粘贴。