如何将vector <wstring>转换为wchar_t **?</wstring>

时间:2013-07-29 05:48:20

标签: c++ c type-conversion

我需要创建一个C兼容(友好)返回类型,以便我的C ++函数可以用于处理基于C的函数。

如何将wstring的矢量转换为wchar_t**数组?

5 个答案:

答案 0 :(得分:1)

您可以遍历wstring矢量并将每个wstring::c_str()添加到wchart_t**数组中。

答案 1 :(得分:1)

如果可能的话,最好避免这样做。

如果确实别无选择,你基本上会做一些事情,比如分配一个指针数组,然后为每个字符串分配空间,并将输入中的每个字符串复制到你分配的缓冲区

wchar_t *dupe_string(std::wstring const &input) { 
    wchar_t *ret = new wchar_t[input.size()+1];
    wcscpy(ret, input.c_str());
    return ret;
}

wchar_t **ruin(std::vector<std::wstring> const &input) {
    wchar_t **trash = new wchar_t*[input.size()];
    for (int i=0; i<input.size(); i++)
       trash[i] = dupe_string(input[i]);
    return trash;
}

然而,根据评论,我对此适用于当前情况有一些疑虑 - 这假设输入是宽字符串,这通常意味着UTF-16或UTF-32 / UCS-4。如果输入实际上是UTF-8形式,那么您正在处理的存储元素将是char,而不是wchar_t,因此您的输入应该是窄字符串({{1} })和匹配的输出std::string而不是char **

答案 2 :(得分:1)

wstring是basic_string的模板实例化,因此它的c_str()函数返回wchar_t *。

所以,你可以做类似

的事情
std::vector<const wchar_t*> pointers;
pointers.reserve(wstrVec.size());
for (auto it = wstrVec.begin(); it != wstrVec.end(); ++it) {
    pointers.push_back(it->c_str());
}

const whcar_t** cptr = pointers.data();

如果没有更多的上下文,很难建议处理范围/生命周期问题的最佳方法。你在编写一个库(这表明你无法控制范围)或者为你正在监督的C代码提供回调api吗?

一种常见的方法是提供一个大小调整api,以便调用者可以提供适当大小的目标缓冲区:

size_t howManyWstrings()
{
    return wstrVec.size();
}

bool getWstrings(const wchar_t** into, size_t intoSize /*in pointers*/)
{
    const size_t vecSize = wstrVec.size();
    if (intoSize < vecSize || into == nullptr)
        return false;
    for (size_t i = 0; i < vecSize; ++i) {
        into[i] = wstrVec[i].c_str();
    }
    return true;
}

答案 3 :(得分:1)

听起来你的C函数期望指向wchar_t缓冲区的指针,并且能够移动这个指针。

嗯,这很容易,但你必须管理指针的生命周期。为此,我建议将此作为返回类型(因此让C破坏您的API,更不用说您的代码的健全性),而是在C函数的调用站点执行此逻辑:

/** A function that produces your vector */
std::vector<wchar_t> foo();

/** The C function in question */
void theCFunction(wchar_t**);

int main()
{
   std::vector<wchar_t> v = foo();
   wchar_t* ptr = &v[0];
   theCFunction(&ptr);
}

BTW从问题和一些评论中听起来你误解了charwchar_t - 他们坐在下面编码层和如果您有UTF-8,那么您应该将UTF-8字符串的每个字节存储为单个字节。这意味着使用char s,就像在std::string中一样。当然,该字符串中的每个字节不一定代表单个逻辑unicode字符,但那不是它的重点。

答案 4 :(得分:0)

这是将std :: wstring的矢量转换为基于wchar_t **的字符串的函数 由于使用了DisposeBuffer(),它也不会泄漏任何内存;打电话不像其他答案。

wchar_t ** xGramManipulator::GetCConvertedString(vector< wstring> const &input)
{
    DisposeBuffer();  //This is to avoid memory leak for calling this function multiple times
    cStringArraybuffer = new wchar_t*[input.size()]; //cStringArraybuffer is a member variable of type wchar_t**
    for (int i = 0; i < input.size(); i++)
    {
        cStringArraybuffer[i] = new wchar_t[input[i].size()+1];
        wcscpy_s(cStringArraybuffer[i], input[i].size() + 1, input[i].c_str());
        cStringArraySize++;
    }
    return cStringArraybuffer;
}

这是DisposeBuffer Helper函数,可以避免内存泄漏:

void xGramManipulator::DisposeBuffer(void)
{
    for (size_t i = 0; i < cStringArraySize; i++)
    {
        delete [] cStringArraybuffer[i];
    }
    delete [] cStringArraybuffer;
    cStringArraybuffer = nullptr;
    cStringArraySize = 0;
}

在这些之前,在构造函数中分配一个虚拟空间:

xGramManipulator::xGramManipulator()
{
    //allocating dummy array so that when we try to de-allocate it in GetCConvertedString(), dont encounter any undefined behavior

    cStringArraybuffer = new wchar_t*[1];
    cStringArraySize = 0;
    for (int i = 0; i < 1; i++)
    {
        cStringArraybuffer[i] = new wchar_t[1 + 1];
        cStringArraySize++;
    }
}

这一切都完成了:)