用空字符串替换json字符串中的双引号

时间:2011-01-13 13:51:17

标签: c# regex string json replace

我对json字符串的反序列化有问题,因为字符串格式不正确。

例如,json对象包含字符串属性statusMessage,其值为“Hello ”dog“”。

正确的格式应为“Hello \”dog \“”。

我想从此属性中删除双引号。

像这样的东西。 “你好”狗“”。 - > “你好狗”。

这是我工作的原始json字符串。

"{\"jancl\":{\"idUser\":18438201,\"nick\":\"JANCl\",\"photo\":\"1\",\"sex\":1,\"photoAlbums\":1,\"videoAlbums\":0,\"sefNick\":\"jancl\",\"profilPercent\":75,\"emphasis\":false,\"age\":\"-\",\"isBlocked\":false,\"PHOTO\":{\"normal\":\"http://u.aimg.sk/fotky/1843/82/n_18438201.jpg?v=1\",\"medium\":\"http://u.aimg.sk/fotky/1843/82/m_18438201.jpg?v=1\",\"24x24\":\"http://u.aimg.sk/fotky/1843/82/s_18438201.jpg?v=1\"},\"PLUS\":{\"active\":false,\"activeTo\":\"0000-00-00\"},\"LOCATION\":{\"idRegion\":\"6\",\"regionName\":\"Trenčiansky kraj\",\"idCity\":\"138\",\"cityName\":\"Trenčianske Teplice\"},\"STATUS\":{\"isLoged\":true,\"isChating\":false,\"idChat\":0,\"roomName\":\"\",\"lastLogin\":1294925369},\"PROJECT_STATUS\":{\"photoAlbums\":1,\"photoAlbumsFavs\":0,\"videoAlbums\":0,\"videoAlbumsFavs\":0,\"videoAlbumsExts\":0,\"blogPosts\":0,\"emailNew\":0,\"postaNew\":0,\"clubInvitations\":0,\"dashboardItems\":1},\"STATUS_MESSAGE\":{\"statusMessage\":\"\"Status\"\",\"addTime\":\"1294872330\"},\"isFriend\":false,\"isIamFriend\":false}}"

问题在这里,json字符串包含这个对象:

"STATUS_MESSAGE": {"statusMessage":" "some "bad" value"   ", "addTime" :"1294872330"}

我想要修改的字符串的条件:

  • 字符串以“statusMessage”开头:“
  • string可以从0-N *
  • 获得任何* 长度
  • 字符串以“,”addTime
  • 结尾

所以我尝试编写以“statusMessage”开头的字符串模式:“,有任何长度,以”,“addTime结束。

就是这样:

 const string pattern = "  \" statusMessage \" : \"  .*?  \",\"addTime\"  ";

 var regex = new Regex(pattern, RegexOptions.IgnoreCase);

//here i would replace " with empty string
 string result = regex.Replace(jsonString, match => ???);

但我认为模式是错误的,我也不知道如何用空字符串替换双引号(删除双引号)。

我的目标是:

"statusMessage":" "some "bad" value"

"statusMessage":" "some bad value"

感谢您的建议

4 个答案:

答案 0 :(得分:2)

要在客户端序列化json,我使用类似这样的东西:

    var JSON = JSON || {};  

    JSON.stringify = JSON.stringify || function (obj) {
        var t = typeof (obj);
        if (t != "object" || obj === null) {
            // simple data type  
            if (t == "string") obj = '"' + obj + '"';
            return String(obj);
        }
        else {
            // recurse array or object  
            var n, v, json = [], arr = (obj && obj.constructor == Array);
            for (n in obj) {
                v = obj[n]; t = typeof (v);
                if (t == "string") v = '"' + v + '"';
                else if (t == "object" && v !== null) v = JSON.stringify(v);
                json.push((arr ? "" : '"' + n + '":') + String(v));
            }
            return (arr ? "[" : "{") + String(json) + (arr ? "]" : "}");
        }
    };

然后

$.ajax({
    ...
    data: JSON.stringify({
        someThing1: [
            { Id: '001', FooValue: ''},
            { Id: '002', FooValue: ''}
        ],
        someThing2: [
            { Id: '001', FooValue: ''},
            { Id: '002', FooValue: ''}
        ]
    }),
    ...
});

在服务器端,我使用Newton.Json(http://james.newtonking.com/pages/json-net.aspx

object deserializeObject = JsonConvert.DeserializeObject(requestParameterTextRepresentation, RootType);

如果您无法修改客户端脚本以传递正确的json-string,那么所有正则表达式都是徒劳的。

答案 1 :(得分:1)

虽然这是一个非常弱的,hacky解决方案,但这应该在简单的情况下起作用:

string pattern = @"(?<=""statusMessage"":"").*?(?="",""addTime"")";
string result = Regex.Replace(malformedJSON, pattern,
                              match => match.Value.Replace("\"", ""));

我正在使用lookarounds来查找字符串,然后从中删除所有引号。您也可以使用"\\\""替换它们来逃避它们。

答案 2 :(得分:1)

这应该这样做:

var str = '"STATUS_MESSAGE": {"statusMessage":" "some "bad" value"   ", "addTime" :"1294872330"}"';
str = str.replace(/("statusMessage"\s*:\s*")(.+?)("\s*,\s*"addTime)/, function(m0,m1,m2,m3) { return m1 + m2.replace(/"/g,'') + m3; });

//now str == "STATUS_MESSAGE": {"statusMessage":" some bad value   ", "addTime" :"1294872330"}"

编辑:对不起我不知道为什么我把它与javascript问题混淆了:s - 你能够在c#中做一个非常类似的方法,我现在无法提出语法。

答案 3 :(得分:1)

试试这个(虽然不是一个完美的解决方案):

            string data = "\"STATUS_MESSAGE\": {\"statusMessage\":\" \"some \"bad\" value\"   \", \"addTime\" :\"1294872330\"}";

        Regex rxStatusMessage = new Regex("\\s*\"statusMessage\"\\s*:\"\\s*");
        Regex rxAddTime = new Regex("\",\\s*\"addTime\"\\s*:");

        data = rxStatusMessage.Replace(data, "\x02");
        data = rxAddTime.Replace(data, "\x03");

        Regex rxReplace = new Regex("\x02.*\x03");

        data = rxReplace.Replace(data, m => m.Value.Replace("\"", ""));

        data = data.Replace("\x02", "\"statusMessage\":\"");
        data = data.Replace("\x03", "\", \"addTime\" :");