读取文件并删除重复的字母

时间:2009-11-20 09:11:13

标签: c++ arrays fstream ifstream

所以我的目标是创建一个具有部分填充字符数组的函数作为形式参数,并删除数组中所有重复的字母。所以我只需要读一个.txt文件,其内容类似于“11 A B C a b c a A g g t”,并让程序吐出“A B C a b c g t”

截至目前,我的节目回吐“1 A B C a b c”

我真的很感激任何帮助。

这是我的......

#include <iostream>
#include <fstream>
using namespace std;

bool deleterepeat( char arraytocheck[], char lettertocheck, int length)
{
    bool onlistflag = false;
    {
    for (int i = 0; i < length; i++)
    {
        if (arraytocheck[i] == lettertocheck)
        {
            onlistflag = true;
        }
    }
    }
    return onlistflag;
}



int main()

{       
    const int MAX = 15;
    char inFile[MAX];
    char clearedList[MAX];
    int clearedlength = 0;

        cout << "Choose a file: ";
        cin.getline(inFile, 15);
        ifstream in(inFile);

    if(!in) {
        cout << "Cannot open input file.\n";
        return 1;
    }


    while(in) {
        in.getline(inFile, MAX);


        for (int i = 0; i < MAX; i++)
        {
            in >> inFile[i];
        }
        for (int i = 0; i < MAX; i++)
        {
            if (deleterepeat(clearedList, inFile[i], i) == false)
            {
                clearedList[clearedlength] = inFile[i];
                clearedlength++;
            }
        }

        for (int i = 0; i < clearedlength; i++)
        {
            cout << clearedList[i] << " ";
        }



        if(in) cout << inFile << endl;
    }

    cout << endl;
    cin >> inFile;

    in.close();

    return 0;
}

4 个答案:

答案 0 :(得分:2)

首先使用sort算法对数组进行排序,然后使用unique算法删除所有相邻的重复项。

这是一个示例函数,它接受一个字符串(从文件中读取一行)并返回一个包含所有唯一字符的字符串:

string getUniqueCharacters( string s )
{
    sort( s.begin(), s.end() );
    string::iterator newEnd = unique( s.begin(), s.end() );
    return string( s.begin(), newEnd );
}

对于输入字符串11 A B C a b c a A g g t,上面的函数会产生1ABCabcgt(请注意,空格字符被视为与任何其他字符一样)。

此函数具有O(n * log n)复杂度,因此即使对于长字符串,它仍然相当快。此外,如果您的字符串中包含超过256个字符(想到unicode),此算法也可以使用。只需将string更改为wstring即可。

答案 1 :(得分:1)

#include <iostream>
#include <fstream>
using namespace std;

int main() {       
    string ins, outs; // resizable

    cout << "Choose a file: ";
    cin >> ins;
    ifstream in(ins);

    if(!in) {
        cout << "Cannot open input file.\n";
        return 1;
    }

    while(in >> ins){
        for(string::const_iterator it = ins.begin(); it != ins.end(); ++it){
            if(outs.find(*it, 0) == string::npos){
                outs.append(1, *it);
            }
        }
    }
    in.close();

    cout << outs << endl;

    return 0;
}

是我认为你想要做的。但如果你知道你在工作 使用ascii(通常是一个合理的假设)你可以戏剧性地 提高性能(从二次到线性时间,如果str.find()是线性的) 保持一个数组bool [256]并使用if(see [* it])而不是a 搜索。或者,更加可扩展,引入STL地图容器,这将让您找到一个列表 任意长度的独特字符串。

答案 2 :(得分:1)

std::string f(istream & is) {
    bool known[256] = { false };
    char ch;
    std::string result;
    while (is >> ch) {
        if (! known[ch] /* || std::ispace(ch) */) {
            result += ch;
            known[ch] = true;
        }
    }
    return result;
}

或(未经测试)

struct NotAgain {
    NotAgain() {
        std::fill_n(&known_[0], 256, false);
    }
    bool operator()(char ch) {
        const bool r = known_[ch];
        known_[ch] = true;
        return r;
    }
private:
    bool known_[256];
};

void f(std::string & buffer) {
    buffer.erase(
            std::remove_if(
                buffer.begin(),buffer.end(),
                NotAgain()),
            buffer.end());
}

或者它可以直接在stream_iterator上使用。这个想法总是一样的,有一个256个元素的数组,可以记住已经看过的角色。或者当然,它适用于角色,因为它们的数量很少且数量有限。该解决方案不会扩展太多。有了更多的独特元素,你必须考虑关联映射(std :: map(tree)/ std :: unordered_map(hash))

答案 3 :(得分:0)

这是一个简单的东西,我可以给你这个过程....

1.从输入数组中读取一个字符。

2.检查它是否存在于输出数组中。

3.如果没有,则将其插入输出数组,对输入数组的所有字符重复该过程。