Tab / LF / CR unicode字符

我有一个Unicode文件（UTF-16 FFFE little-endian BOM），它包含多个以制表符分隔的字段。

在ruby中使用.split读取拆分unicode（我认为），我将使用Ruby拆分（文件到行，然后行到字段）。

BTW，什么是Unicode字符：

如果
CR
标签

谢谢！

 LF：U + 000A  
 CR：U + 000D  
标签：U + 0009

http://en.wikipedia.org/wiki/List_of_Unicode_characters

Unicode TAB是u0009 。 LF是u000d ，CR是u000d

实际上与ASCII相同。

Interesting Posts

在Ruby 1.9.X中等效的Iconv.conv（“UTF-8 // IGNORE”，…）？

使用www :: mechanize时的Iconv :: IllegalSequence

用Ruby中的Iconv音译

Ruby转换字符串编码从ISO-8859-1到UTF-8不起作用

使用Ruby将UTF8转换为ANSI

从Ruby 1.8.7到系统调用iconv将文件从utf-16转换为utf-8

通过ruby2.0.0在Windows上安装iconv时出错

使用Ruby中的Watir填充text_field时的编码问题

Ruby Iconv适用于irb和ruby调试器，但不适用于unit testing

使用Ruby上载文件字符集转换