Tab / LF / CR unicode字符
我有一个Unicode文件(UTF-16 FFFE little-endian BOM),它包含多个以制表符分隔的字段。
在ruby中使用.split读取拆分unicode(我认为) ,我将使用Ruby拆分(文件到行,然后行到字段)。
BTW,什么是Unicode字符:
- 如果
- CR
- 标签
谢谢!
LF:U + 000A CR:U + 000D 标签:U + 0009
Unicode TAB是u0009
。 LF是u000d
,CR是u000d
实际上与ASCII相同。