生成Lucene.NET同义词列表XML的最简单方法是什么?

时间:2012-05-24 08:30:11

标签: lucene lucene.net

生成用于Lucene.NET的同义词列表XML的最简单方法是什么?根据我的阅读,Lucene.NET将加载一个XML文档,如以下格式:

<?xml version="1.0" encoding="utf-8" ?>
<synonyms>
<group>
    <syn>fast</syn>
    <syn>quick</syn>
    <syn>rapid</syn>
</group>

<group>
    <syn>slow</syn>
    <syn>decrease</syn>
</group>

<group>
    <syn>google</syn>
    <syn>search</syn>
</group>

<group>
    <syn>check</syn>
    <syn>lookup</syn>
    <syn>look</syn>
</group>
</synonyms>

我尝试过搜索一个工具,该工具会使用CSV并以正确的格式吐出XML文档。但是,我很惊讶没有找到任何东西。所以我的理解是不正确的,像上面这样的XML文档不是在Lucene.net中加载同义词的方法,或者我没有正确搜索。

任何帮助都将不胜感激。

1 个答案:

答案 0 :(得分:0)

您的xml来自CodeProject文章Lucene.Net - Custom Synonym Analyzer,其中还包含一个XmlSynonymEngine来解析您的xml。您可以构建自定义ISynonymEngine来直接解析csv数据,而无需将输入转换为xml。