快速的字符串比较方式

时间:2015-03-28 20:40:46

标签: c++ string string-comparison

我有一个简单的问题,但这让我很困惑。

我有两个字符串,我想计算两者之间有多少个不同的字符。字符串排序,长度相等。不要拆分字符串。

例如

input:  abc, bcd
output: 2, because a and d are different characters

input:  abce, bccd
output: 4, because a, c, d and e are different.

我知道我可以在O(N ^ 2)中完成它,但是如何在O(N)中为这些排序的字符串解决它?

只需要不同字符的数量,无需指明哪个数字。

4 个答案:

答案 0 :(得分:3)

我原本以为你需要一个相当复杂的算法,比如Smith-Waterman。但是对输入的限制使得在O(m + n)中实现它变得相当容易,其中m是第一个字符串的长度,n是第二个字符串的长度。

我们可以使用内置算法来计算共同的字符数,然后我们可以使用该信息来生成您要查找的数字:

#include <algorithm>
#include <iostream>
#include <string>

int main() {
    std::string m = "abce";
    std::string n = "bccd";
    std::string result;

    std::set_intersection(
            m.begin(), m.end(),
            n.begin(), n.end(),
            std::back_inserter(result));

    std::cout << m.size() + n.size() - 2 * result.size() << "\n";
}

在这种特殊情况下,它会根据您的需要输出4

答案 1 :(得分:1)

看到答案真的很简单,感谢@Bill Lynch,我的解决方案可能太复杂了!无论如何,它只是一个简单的计数差异。

#include <iostream>
#include <algorithm>
#include <array>

int main() {
    std::array<int,26> str1 = {};
    std::array<int,26> str2 = {};

    std::string s1("abce");
    std::string s2("bccd");


    for(char c : s1)
        ++str1[c-'a'];
    for(char c : s2)
        ++str2[c-'a'];

    int index = 0;

    std::cout << std::count_if(str1.begin(),str1.end(),[&](int x)
    {
        return x != str2[index++];
    });
}

它的O(n+m),除非我在分析中犯了错误。

答案 2 :(得分:0)

你可以使用dynamic programming来实现O(n)。即使用整数d来存储差异。

Algo:
move from lower index to higher index of both array.  
if a[i] not equal b[j]:
           increase d by 2
           move the index of smaller array and check again.
if a[i] is equal to b[j] : 
           decrease d by 1
           move both index
repeat this until reach the end of array

答案 3 :(得分:-1)

O(2n)和O(n)完全相同,因为&#34; O&#34;表示方法成本的渐近行为。

更新:我刚注意到你的O(N2)意味着O(n ^ 2)。

如果您需要进行比较,那么您的费用总是为O(n ^ 2),因为您必须:

1)循环,用于单词的每个字符,这是 O(n)

2)比较每个单词中的当前字符,您必须使用包含您已检查过的字符的临时列表。所以,这是另一个嵌套的O(n)。

所以,O(n)* O(n)= O(n ^ 2)

注意:你总是可以忽略O表达式中的数字系数,因为它并不重要。