sphinx搜索如何忽略html编码文本

时间:2015-04-01 23:31:28

标签: sphinx

当我在标题中搜索项目123时,我遇到了这个问题,我将无法获得正确的数据。

在sphinx中,我有一个名为title的字段,某些模型在html中有商标。

我无法从标题中删除html编码。

我可以忽略这些话吗?

例如搜索123™

想忽略™

MATCH('@!(content,synonym) 123')

我尝试过使用停用词,例外

1 个答案:

答案 0 :(得分:0)

我会使用regex_filter搜索并将这些内容替换为空。

它是关于适用于charset_table标记化的唯一指令