广义后缀树Java实现

时间:2009-06-09 11:17:03

标签: java suffix-tree

我正在寻找具有以下功能的广义后缀树(GST)的Java实现:

从1000个字符串创建GST后,我想知道这1000个字符串中有多少包含其他字符串'。

搜索必须保持安静,因为我需要对大约100'000个平均长度为10的候选字符串应用搜索。

5 个答案:

答案 0 :(得分:4)

试试The Semantic Discovery Toolkit。它在text / src / java / org / sd / text / radixtree

上有一个实现

答案 1 :(得分:3)

答案 2 :(得分:3)

我在Java中创建了一个后缀树,允许您轻松添加自己的搜索功能和其他匹配算法。我的博客文章Suffix Trees in Java概述了下载最新版本的说明。我的Java实现基于Mark Nelson的Fast String Searching With Suffix Trees文章。

更新2016-06-18

答案 3 :(得分:2)

您可以在此处找到Generalized Suffix Tree in Java的实施。 我试图尽可能多地记录它,所以你可能会发现它很有用。

答案 4 :(得分:0)

这是我对SuffixTree的实现: https://github.com/losvald/sglj/blob/master/src/main/java/org/sglj/util/PATTrie.java

除其他外,它支持在节点中存储任意数据,并查找与前缀相关联的值集。