键值对的算法,其中键是字符串

时间:2012-09-11 14:07:36

标签: database algorithm search indexing inverted-index

我遇到一个问题,那里有一个巨大的字符串或短语列表,可能会从100,000到100万。当我搜索一个短语,如果发现它给我数据库的Id或索引进一步操作。我知道哈希表可以用于此,但我正在寻找其他算法,它可以让我根据字符串生成索引,也可以用于其他一些功能,如自动完成等。

我根据它们服务于目的的某些SO线程读取后缀树/数组,但消耗的内存比我能承受的多。有什么替代品吗?

由于我的搜索只是在数百万字符串的巨大列表中。没有文档没有网页对lucene等搜索引擎不感兴趣。

还阅读有关倒置索引声音有用但我需要为哪个算法研究它?

1 个答案:

答案 0 :(得分:1)

如果此数据库索引位于MS SQL Server中,则可以使用SQL全文索引获得良好的结果。其他SQL提供程序可能具有类似的功能,但我无法帮助它们。

退房:http://www.simple-talk.com/sql/learn-sql-server/understanding-full-text-indexing-in-sql-server/

http://msdn.microsoft.com/en-us/library/ms142571.aspx