Tab / LF / CR unicode字符

我有一个Unicode文件(UTF-16 FFFE little-endian BOM),它包含多个以制表符分隔的字段。

在ruby中使用.split读取拆分unicode(我认为) ,我将使用Ruby拆分(文件到行,然后行到字段)。

BTW,什么是Unicode字符:

  • 如果
  • CR
  • 标签

谢谢!

 LF:U + 000A  
 CR:U + 000D  
标签:U + 0009  

http://en.wikipedia.org/wiki/List_of_Unicode_characters

Unicode TAB是u0009 。 LF是u000d ,CR是u000d

实际上与ASCII相同。