正则表达式String.split()

时间:2013-01-15 20:10:16

标签: java regex string

我正在使用java来拆分表单的字符串:

String stringToSplit = "AAA BBB CCC DDD EEE FFF GGG HHH III JJJ KKK";

我正在使用

String[] tokens = stringToParse.split("\\s");

沿着空格分割字符串,给出:

tokens = {"AAA","BBB","CCC", "DDD","EEE","FFF","GGG","HHH","III", "JJJ", "KKK"} 

我现在需要做的是在大多数情况下按空白划分,但在特定情况下也要保留一些字符串。例如,我希望“CCC DDD”和“III JJJ KKK”在我拆分时保持完整的字符串。所以我希望我的令牌数组是:

tokens = {"AAA","BBB","CCC DDD","EEE","FFF","GGG","HHH","III JJJ KKK"}

我会使用什么正则表达式?这可能吗?

2 个答案:

答案 0 :(得分:6)

你可以用ccc_ddd替换ccc ddd,然后稍后将下划线转换回空格。

如果你要做很多这样的事情,你可能想投资某种语法解析器

答案 1 :(得分:3)

您可以使用以下方法找到所有连续的非空白字符,而不是使用split(),但是使用替换也可以匹配包含空格的特定目标字符串:

Pattern p = Pattern.compile("CCC DDD|III JJJ KKK|\\S+");
Matcher m = p.matcher("AAA BBB CCC DDD EEE FFF GGG HHH III JJJ KKK");
while(m.find()) {
    System.out.println(m.group());
}

示例:http://ideone.com/AxI1CV