如何在libxml2中添加由string构造的xml节点

时间:2012-10-17 05:16:36

标签: c xml libxml2

我使用Libxml2对xml文件中的数据进行编码。我的数据包含“<”等标签和“>”。当它被转换成xml时,这些标签也被转换成“& lt”和“& gt”。有没有办法解决这个问题。我想在解码那个xml文件时将这些标签用作xml节点,因此CDATA不是解决此问题的方法。请为此提供任何解决方案。谢谢。

示例代码:

xmlNewChild(node, NULL, (xmlChar *)"ADDRESS", (xmlChar *)"<street>Park Street</street><city>kolkata</city>");

and output of above code is:
<person>
<ADDRESS>&lt;street&gt;Park Street&lt;/street&gt;&lt;city&gt;Kolkata&lt;/city&gt;</ADDRESS>

4 个答案:

答案 0 :(得分:3)

如果您希望将字符串视为xml,则应使用xmlReadMemory对其进行解析并从中获取xmlDoc。它可用于较大的字符串,但通常使用单步指令构建文档,如Joachim的答案。在这里,我提出了xmlAddChildFromString函数来以字符串方式完成这些工作。

#include <stdio.h>
#include <string.h>
#include <libxml/parser.h>
#include <libxml/tree.h>

/// Returns 0 on failure, 1 otherwise
int xmlAddChildFromString(xmlNodePtr parent, xmlChar *newNodeStr)
{
  int rv = 0;
  xmlChar *newNodeStrWrapped = calloc(strlen(newNodeStr) + 10, 1);
  if (!newNodeStrWrapped) return 0;
  strcat(newNodeStrWrapped, "<a>");
  strcat(newNodeStrWrapped, newNodeStr);
  strcat(newNodeStrWrapped, "</a>");
  xmlDocPtr newDoc = xmlReadMemory(
    newNodeStrWrapped, strlen(newNodeStrWrapped),
    NULL, NULL, 0);
  free(newNodeStrWrapped);
  if (!newDoc) return 0;
  xmlNodePtr newNode = xmlDocCopyNode(
    xmlDocGetRootElement(newDoc),
    parent->doc,
    1);
  xmlFreeDoc(newDoc);
  if (!newNode) return 0;
  xmlNodePtr addedNode = xmlAddChildList(parent, newNode->children);
  if (!addedNode) {
    xmlFreeNode(newNode);
    return 0;
  }
  newNode->children = NULL; // Thanks to milaniez
  newNode->last = NULL;     // for fixing
  xmlFreeNode(newNode);     // the memory leak.
  return 1;
}

int
main(int argc, char **argv)
{
    xmlDocPtr doc = xmlNewDoc(BAD_CAST "1.0");
    xmlNodePtr root = xmlNewNode(NULL, BAD_CAST "root");
    xmlDocSetRootElement(doc, root);
    xmlAddChildFromString(root,
      "<street>Park Street</street><city>kolkata</city>");
    xmlDocDump(stdout, doc);
    xmlFreeDoc(doc);
    return(0);
}

答案 1 :(得分:2)

您必须在链中调用xmlNewChild,为父节点调用一次,并为每个子节点调用一次:

xmlNodePtr *addressNode = xmlNewChild(node, NULL, (xmlChar *) "address", NULL);
xmlNewChild(addressNode, NULL, (xmlChar *) "street", "Park Street");
xmlNewChild(addressNode, NULL, (xmlChar *) "city", "Koltaka");

答案 2 :(得分:2)

您可以尝试使用函数xmlParseInNodeContext。它允许您在父节点的上下文中解析原始XML,并构造一个可以附加到父节点的节点。

例如:

const char * xml = "<a><b><c>blah</c></b></a>";
xmlNodePtr new_node = NULL;

// we assume that 'parent' node is already defined
xmlParseInNodeContext(parent, xml, strlen(xml), 0, &new_node);
if (new_node) xmlAddChild(parent, new_node);

答案 3 :(得分:1)

我现在使用以下代码将XML文本(可能包含多个元素)注入现有节点(感谢Nazar和nwellnhof的一个答案,并将我的问题(Injecting a string into an XML node without content escaping)引用到此一个):

std::string xml = "<a>" + str + "</a>";
xmlNodePtr pNewNode = nullptr;
xmlParseInNodeContext(pParentNode, xml.c_str(), (int)xml.length(), 0, &pNewNode);
if (pNewNode != nullptr)
{
    // add new xml node children to parent
    xmlNode *pChild = pNewNode->children;
    while (pChild != nullptr)
    {
        xmlAddChild(pParentNode, xmlCopyNode(pChild, 1));
        pChild = pChild->next;
    }

    xmlFreeNode(pNewNode);
}

它需要字符串(str)添加一个周围的元素(&lt; a&gt; ...&lt; a /&gt;),使用 xmlParseInNodeContext 解析字符串,然后添加子元素父节点的新节点。重要的是添加新节点的子节点而不是新节点以避免具有&lt; a&gt; ...&lt; a /&gt;在最终的XML中。