Ruby:无法解析在OS X中导出为CSV的Excel文件

我正在使用Ruby的CSV库来解析一些CSV。 我有一个看似格式正确的CSV文件,我通过将Excel文件导出为CSV来创建。

CSV.open(filename, 'r')会导致CSV::IllegalFormatError

文件中没有流氓逗号或引号,也没有任何我可以看到可能导致问题的内容。

我怀疑问题可能与行结尾有关。 我能够解析通过文本编辑器(Aquamacs)手动输入的数据。 就在我尝试从Excel(OS X)导出的数据时,会出现问题。 当我在vim中打开导出的CSV时,所有文本都显示在一行上,行之间出现^M

从文档中,似乎你可以提供一个行分隔符; 但我不确定在这种情况下应该是什么。

尝试: CSV.open('filename', 'r', ?,, ?\r)

正如cantlin所说,对于Ruby 2来说,它是:

 CSV.new('file.csv', 'r', :col_sep => ?,, :row_sep => ?\r) 

我很确定这些会为你DTRT。 您还可以使用以下vim命令“修复”文件本身(在这种情况下保持旧open:%s/\r/\r/g

是的,我知道这个命令看起来像一个完全无操作,但它会起作用。

剥离\ r字符似乎对我有用

 CSV.parse(File.read('filename').gsub(/\r/, ' ')) do |row| ... end 

另一个选项是在Excel中打开CSV文件或原始电子表格,并将其另存为“Windows逗号分隔”而不是“逗号分隔值”。 这将输出FasterCSV能够理解的行结尾的文件。

“”当我在vim中打开导出的CSV时,所有文本都出现在一行上,行之间出现^ M.

从文档中,似乎你可以提供一个行分隔符; 但我不确定在这种情况下应该是什么。 “””

回读一个句子…… ^ M表示键盘Ctrl-M又名’\ x0D’(M是ASCII字母表的第13个字母; 0x0D == 13)aka ASCII CR(回车)又名’\ r’… IOW Macs在OS X之前曾经用作线路终结器。

似乎较新版本的CSV解析器和/或它使用的任何组件都没有问题地读取DOS / Windows行结尾。 Mac OS X的库存(不确定版本)没有削减它,安装了Ruby 2.0.0并且它解析了文件就好了,没有特殊的参数……

我有类似的问题。 我收到一个错误:

 "error_message"=>"Illegal quoting in line 1.", "error_class"=>"CSV::MalformedCSVError" 

问题是文件有Windows行结尾,当然不是Unix。 帮助我的是定义row_sep:“\ r \ n”:

 CSV.open(path, 'w', headers: :first_row, col_sep: ';', quote_char: '"', row_sep: "\r\n")