Solr.NET和汉字

时间:2012-09-25 13:07:28

标签: unicode solr cjk solrnet

我有一个处理英文和中文内容的搜索索引。所有文档都由Solr.NET导入SOLR

当我从浏览器中搜索中文内容时(localhost:8389 / solr / ...)一切正常,但是当我使用Solr.NET执行搜索时,我得到0点击:(

我尝试设置logger以查看浏览器搜索和Solr.NET搜索之间的区别,但我得到问号(??????)而不是中文字符。

非常感谢任何帮助!

1 个答案:

答案 0 :(得分:0)

使用浏览器而不是Notepad ++打开solr0.log,以确保这是一个真正的问题并找出文件保存的编码 - 如果它不是Unicode,很可能是Solr.NET不能搜索一下。

由于编码(Notepad ++不支持gb或big5等典型的中文编码),或者因为默认字体(可能支持或不支持中文字符),因此已知Notepad ++有中文问题。浏览器更宽容,并且可以执行任何操作以正确显示文件。事实上,要将非unicode亚洲编码转换为unicode,我经常在浏览器中打开一个文件,它将检测正确的编码并显示原始内容,然后按CTRL + A CTRL + C CTRL + V将所有内容导入编辑器,保存作为UTF-8,完成了。

相关问题