正则表达式用preg_replace转义双引号内的双引号

时间:2012-09-05 22:55:23

标签: php

我一直在努力逃避双引号内的所有双引号(是的,疯狂的),我终于放弃了。我有这样的数据:

{ "test": "testing with "data" like this", "subject": "trying the "special" chars" }

我一直在尝试将" \"/"(.*)+, "/内的{ "test": "testing with "data" like this", "subject": "trying the "special" chars" } 进行preg_replace,这意味着双引号内的所有内容,后跟逗号和空格。

我需要一种方法来解决这个问题:

{ "test": "testing with \"data\" like this", "subject": "trying the \"special\" chars" }

进入这个:

{{1}}

使用preg_replace。

1 个答案:

答案 0 :(得分:10)

看看你的正则表达式我会建议阅读regex greediness.如果你在第一个逗号的引号之间选择所有内容,你会遇到问题。返回的第一件事是test": "testing with "data" like this,那么如果您用"替换所有\",那么您将拥有test\": \"testing with \"data\" like this,这显然不是您想要的。我建议使用这样的东西:

/"((?:.|\n)*?)"\s*[:,}]\s*/

<强>解释

  • "((?:.|\n)*?)" - 捕获两个引文之间的任何字符;仍然具有真实模式的最小数量
  • \s* - 匹配0个或更多空格字符
  • [:,}] - 匹配冒号,逗号或右括号字符
  • \s* - 匹配0个或更多空格字符

使用此正则表达式和您的数据,返回的第一件事是test。返回的下一件事是testing with "data" like this,所以在替换后你会有testing with \"data\" like this

<小时/> 的更新

$test = '{ "test": "testing with "data" like this", "subject": "trying the "special" chars" }';
$pattern = '/"((?:.|\n)*?)"\s*[:,}]\s*/';
preg_match_all($pattern, $test, $matches);
foreach($matches[1] as $match){
    $answers[] = str_replace('"','\\"',$match);
}
print_r($answers);
// Outputs
// Array ( [0] => test [1] => testing with \"data\" like this [2] => subject [3] => trying the \"special\" chars )

<小时/> 更新2

我认为使用preg_match_all然后使用str_replace是解决问题的更好方法,因为正则表达式更稳定。但如果你坚持使用preg_replace,那么你可以使用这段代码:

$string = '{ "test": "testing with "data" like this", "subject": "trying the "special" chars" }';
$pattern = '/(?<!:|: )"(?=[^"]*?"(( [^:])|([,}])))/';
$string = preg_replace($pattern, '\\"', $string);
print_r($string);
//Outputs
//{ "test": "testing with \"data\" like this", "subject": "trying the \"special\" chars" }

<强>解释

  • (?<! - 启动负面的背后隐藏
  • :|: ) - 将冒号或冒号与空格匹配并结束后视镜
  • " - 匹配引文
  • (?= - 开始积极向前看
  • [^"]*? - 匹配除引号之外的任何内容;仍然具有真实模式的最小数量
  • "(( [^:])|([,}])) - 匹配引号后跟空格和除冒号以外的任何内容或与引号后跟逗号或右括号相匹配
  • ) - 结束前瞻

你可以read more about regex lookaheads here.我认为这个正则表达式很混乱,尽管从技术上讲它是有效的。我打算继续玩它让它变得更好但是我累了所以我现在要去睡觉了。此正则表达式允许您的数据更松散地输入。这些都可以,以及它们的任意组合:

{ "test" : "testing with "data" like this" , "subject" : "trying the "special" chars" }
{"test":"testing with "data" like this","subject":"trying the "special" chars"}