从CSV导入Ruby数组，第一个字段作为散列键，然后在给定标题行的情况下查找字段的值

也许有人可以帮助我。

从像这样的CSV文件开始：

Ticker,"Price","Market Cap" ZUMZ,30.00,933.90 XTEX,16.02,811.57 AAC,9.83,80.02

我设法把它们读成一个数组：

 require 'csv' tickers = CSV.read("stocks.csv", {:headers => true, :return_headers => true, :header_converters => :symbol, :converters => :all} )

要validation数据，这有效：

 puts tickers[1][:ticker] ZUMZ

但是这不是：

 puts tickers[:ticker => "XTEX"][:price]

如何使用自动收录器字段作为唯一键将此数组转换为哈希值，以便我可以轻松地按照输入的第1行中的定义查找任何其他字段？处理更多的列和行。

非常感激！

像这样（它也适用于其他CSV，而不仅仅是你指定的那个）：

 require 'csv' tickers = {} CSV.foreach("stocks.csv", :headers => true, :header_converters => :symbol, :converters => :all) do |row| tickers[row.fields[0]] = Hash[row.headers[1..-1].zip(row.fields[1..-1])] end

结果：

 {"ZUMZ"=>{:price=>30.0, :market_cap=>933.9}, "XTEX"=>{:price=>16.02, :market_cap=>811.57}, "AAC"=>{:price=>9.83, :market_cap=>80.02}}

您可以像这样访问此数据结构中的元素：

 puts tickers["XTEX"][:price] #=> 16.02

编辑（根据评论）：为了选择元素，你可以做类似的事情

  tickers.select { |ticker, vals| vals[:price] > 10.0 }

 CSV.read(file_path, headers:true, header_converters: :symbol, converters: :all).collect do |row| Hash[row.collect { |c,r| [c,r] }] end

要添加到Michael Kohl的答案中，如果要以下列方式访问元素

 puts tickers[:price]["XTEX"] #=> 16.02

您可以尝试以下代码段：

 CSV.foreach("Workbook1.csv", :headers => true, :header_converters => :symbol, :converters => :all) do |row| hash_row = row.headers[1..-1].zip( (Array.new(row.fields.length-1, row.fields[0]).zip(row.fields[1..-1])) ).to_h hash_row.each{|key, value| tickers[key] ? tickers[key].merge!([value].to_h) : tickers[key] = [value].to_h} end

为了充分利用这两个方面（从一个巨大的文件快速读取和本机Ruby CSV对象的好处），我的代码已经演变成这种方法：

 $stock="XTEX" csv_data = CSV.parse IO.read(%`|sed -n "1p; /^#{$stock},/p" stocks.csv`), {:headers => true, :return_headers => false, :header_converters => :symbol, :converters => :all} # Now the 1-row CSV object is ready for use, eg: $company = csv_data[:company][0] $volatility_month = csv_data[:volatility_month][0].to_f $sector = csv_data[:sector][0] $industry = csv_data[:industry][0] $rsi14d = csv_data[:relative_strength_index_14][0].to_f

这更接近我原来的方法，但只读取一个记录加上包含标题的输入csv文件的第1行。内联sed指令负责处理 – 整个过程非常明显。这比上一次要好，因为现在我可以访问Ruby中的所有字段，并且关联，不再关心列号，就像awk的情况一样。

不像1-liner那样，但这对我来说更清楚。

 csv_headers = CSV.parse(STDIN.gets) csv = CSV.new(STDIN) kick_list = [] csv.each_with_index do |row, i| row_hash = {} row.each_with_index do |field, j| row_hash[csv_headers[0][j]] = field end kick_list << row_hash end

虽然这不是原始问题的100％原生Ruby解决方案，但其他人是否应该偶然发现并且想知道我现在使用的awk调用是什么，这里是：

 $dividend_yield = IO.readlines("|awk -F, '$1==\"#{$stock}\" {print $9}' datafile.csv")[0].to_f

其中$ stock是我之前分配给公司股票代码（崇拜关键字段）的变量。通过返回0.0 if：ticker或文件或字段＃9未找到/为空，或者如果值不能被类型转换为浮点数，可以方便地解决问题。所以在我的情况下任何尾随的’％’都被很好地截断了。

请注意，此时可以在awk中轻松添加更多filter，以使IO.readlines从较小的结果CSV返回1-dim输出行数组，例如。

  awk -F, '$9 >= 2.01 && $2 > 99.99 {print $0}' datafile.csv

在bash中输出哪些行的DivYld（col 9）超过2.01，而price（col 2）超过99.99。（不幸的是，我没有使用标题行来确定字段数，这是我最终希望获得一些可搜索的关联Ruby数组的地方。）

从CSV导入Ruby数组，第一个字段作为散列键，然后在给定标题行的情况下查找字段的值

将一行字符串分隔成单独的行

如何在Rails 4中将PDF转换为Excel或CSV

加快csv导入

Ruby 1.9.2导出CSV字符串而不生成文件

阅读时Ruby CSV UTF8编码错误

导入csv文件时，如何在2个模型中进行质量分配？

如何将我的Heroku控制台中的Ruby数组导出为CSV？

使用Ruby CSV提取一列

Rails 3，导入前检查CSV文件编码

使用ruby CSV模块导入csv文件时出现问题