在golang中创建后缀树

时间:2014-03-21 22:46:03

标签: go

我有一个字符串数组,我需要在Golang中创建一个后缀树。 Golang中的SuffixArray不能满足我的需求,因为它只接受字节数组(即单个字符串)。 任何人都可以提供实施指针。 提前谢谢。

3 个答案:

答案 0 :(得分:5)

以下是如何使用后缀数组执行自动完成的示例。 (playground)。

请注意,我将所有字符串加在一起,前缀为\x00,这在字符串中不会出现。

package main

import (
    "fmt"
    "index/suffixarray"
    "regexp"
    "strings"
)

func main() {
    words := []string{
        "aardvark",
        "happy",
        "hello",
        "hero",
        "he",
        "hotel",
    }
    // use \x00 to start each string
    joinedStrings := "\x00" + strings.Join(words, "\x00")
    sa := suffixarray.New([]byte(joinedStrings))

    // User has typed in "he"
    match, err := regexp.Compile("\x00he[^\x00]*")
    if err != nil {
        panic(err)
    }
    ms := sa.FindAllIndex(match, -1)

    for _, m := range ms {
        start, end := m[0], m[1]
        fmt.Printf("match = %q\n", joinedStrings[start+1:end])
    }
}

打印

match = "hello"
match = "hero"
match = "he"

答案 1 :(得分:1)

您想要的是广义后缀树。构建此类树的一种简单方法是将不同的结束标记(未在任何字符串中使用的符号)附加到每个字符串,将它们连接起来并为连接的字符串构建正常的后缀树。所以你只需要添加" hello world"到字符串集并使用:

match, err := regexp.Compile("[^\x00]*wor[^\x00]*")

让字符串包含" wor"。请注意,正确的字符串为joinedStrings[start:end]

答案 2 :(得分:0)

我创建了具有O(n)复杂度的后缀树实现,其中n是字符串的长度:https://github.com/twelvedata/searchindex

我在中等https://medium.com/twelve-data/in-memory-text-search-index-for-quotes-on-go-5243adc62c26上的文章中有更多详细信息