拆分开始和结束时的空字符串

时间:2012-11-07 15:55:36

标签: ruby string perl split

  

可能重复:
  Split problem in Ruby

在Ruby中,当我使用与字符串开头匹配的分隔符拆分字符串时,它会在数组的初始位置给出一个空字符串:

"abc".split(/a/) # => ["", "bc"]

但是当我使用与字符串末尾匹配的分隔符执行类似操作时,它不会给出空字符串:

"abc".split(/c/) # => ["ab"]

这看起来与我不一致。这种说明有什么理由吗?

修改 如果它要与Perl的规范兼容,因为muu是简短的答案,那么问题仍然是相同的:为什么它在Perl中是那样的?因此,现在它也成了关于Perl的问题。

2 个答案:

答案 0 :(得分:9)

来自fine manual

  

split(pattern = $;,[limit])→anArray
  [...]
  如果省略 limit 参数,则会抑制尾随空字段。如果 limit 是正数,则最多将返回该字段数(如果 limit 为1,则整个字符串将作为数组中的唯一条目返回)。如果为负数,则返回的字段数没有限制,并且不会抑制尾随空字段。

所以尾随“空字段”被抑制,因为文档说它们是。如果你想要尾随空字符串,请求它:

'abc'.split(/c/, -1) # [ 'ab', '' ]

为什么会那样?可能是因为它符合Perl's split行为:

  

如果LIMIT为负数,则将其视为任意大;尽可能多的领域。

我们看到再次使用否定limit会给我们尾随空字符串:

$ perl -e 'print join(",", split(/c/, "abc")), "\n"'
ab
$ perl -e 'print join(",", split(/c/, "abc", -1)), "\n"'
ab,

为什么要复制Perl的行为?问马茨。

答案 1 :(得分:4)

在读取AWK的规范之后,mu太短了,我开始觉得AWK中split的初衷是提取对应于字段的子字符串,每个字符串都用{{{标点符号终止。 1}},,,分隔符被视为“字段结束字符”。目的不是将字符串对称地分成每个分隔符位置的左侧和右侧,而是在分隔符位置的左侧终止子字符串。在这个概念下,在分隔符的左侧总是有一些字符串(即使它是空的)是有意义的,但不一定在分隔符的右侧。这可能是通过Perl继承到Ruby的。