在单个文档上查看单个字段的原始Solr标记

时间:2012-05-03 04:59:28

标签: solr sunspot sunspot-rails sunspot-solr

我正在调试我的Solr架构,我希望看到标记特定字段的结果。

有一个简化的例子,如果我有:

<fieldType name="text" class="solr.TextField" omitNorms="false">
    <analyzer>
        <tokenizer class="solr.StandardTokenizerFactory"/>
        <filter class="solr.StandardFilterFactory"/>
        <filter class="solr.LowerCaseFilterFactory"/>
        <filter class="solr.PorterStemFilterFactory"/>
        <filter class="solr.EdgeNGramFilterFactory" minGramSize="2" maxGramSize="15" side="front"/>
    </analyzer>
</fieldType>

我索引了一个值为"Hello, worlds!"的字段,我希望看到以下内容:

hello world he el ll lo hel ell llo hell ello hello wo or rl ld wor orl rld worl orld

确保所有内容都按照我的设想进行标记化。

这有可能吗?

2 个答案:

答案 0 :(得分:6)

是,管理员&gt;分析正是你想要的。

但是还有另一个很棒的工具可以让你阅读索引并查看字段或文档的索引编号。

它被称为Luke,在排除和调整架构时它非常宝贵。

答案 1 :(得分:2)

是的,请使用Solr Admin部分中的Analysis页面:here 它正是这个目的