如何从Ruby中的较大字符串中提取单个字符(作为字符串)?
从字符串中检索单个字符作为单字符字符串的Ruby惯用方法是什么? 当然有str[n]
方法,但是(从Ruby 1.8开始)它返回一个字符代码作为fixnum,而不是字符串。 你如何得到一个单字符串?
在Ruby 1.9中,它很容易。 在Ruby 1.9中,字符串是编码感知的字符序列,所以你可以只索引它,你会得到一个单字符串:
'µsec'[0] => 'µ'
但是,在Ruby 1.8中,字符串是字节序列,因此完全不知道编码。 如果您索引到一个字符串并且该字符串使用多字节编码,则可能会将索引直接编入多字节字符的中间(在此示例中,’μ’以UTF-8编码):
'µsec'[0] # => 194 'µsec'[0].chr # => Garbage 'µsec'[0,1] # => Garbage
但是,Regexps和一些专门的字符串方法至少支持一小部分流行编码,其中包括一些日文编码(例如Shift-JIS)和(在本例中)UTF-8:
'µsec'.split('')[0] # => 'µ' 'µsec'.split(//u)[0] # => 'µ'
在Ruby 1.9之前:
'Hello'[1].chr # => "e"
Ruby 1.9+:
'Hello'[1] # => "e"
Ruby 1.9中已经发生了很多变化 ,包括字符串语义 。
应该在1.9之前和之后为Ruby工作:
'Hello'[2,1] # => "l"
请参阅JörgMittag的评论:这仅适用于单字节字符集。
'abc'[1..1] # => "b"
'abc'[1].chr # => "b"