计算CSV文件的长度(行数)?
我有一个表单(Rails),它允许我使用file_field
加载.csv文件。 在视图中:
{:multipart => true}) do |f| %>
单击“提交”会将我重定向到另一个页面(create.html.erb)。 文件加载正常,我能够在第二页中正确读取内容。 我试图在第二页中显示.csv文件中的行数。
我的控制器(半伪代码):
class UpcsvController < ApplicationController def index end def create file = params[:upcsv][:filename] ... #params[:upcsv][:file_length] = file.length # Show number of lines in the file #params[:upcsv][:file_length] = file.size ... end end
当我的文件只包含7 file.length
, file.length
和file.size
返回’91’。 从我读过的Rails文档中,单击Submit按钮后,Rails会创建上传文件的临时文件,而params[:upcsv][:filename]
包含temp / uploaded文件的内容,而不是路径文件。 我不知道如何提取原始文件中的行数。 获取文件中行数的正确方法是什么?
我的create.html.erb:
File length:
我是Rails的新手(上周刚刚开始),所以请忍受我的愚蠢问题。
谢谢!
更新:显然,数字’91’是我文件中单个字符的数量(包括回车)。 我文件中的每一行都有12位+ 1换行= 13. 91/13 = 7。
另一种读取行数的方法是
file.readlines.size
这里列出的所有解决方案实际上将整个文件加载到内存中以获得行数。 如果您使用的是基于Unix的系统,则更快,更简单且更节省内存的解决方案是:
`wc -l #{your_file_path}`.to_i
.length和.size实际上是同义词。 要获取csv文件的rowcount,你必须实际解析它。 简单地计算文件中的换行符是行不通的,因为csv中的字符串字段实际上可以有换行符。 获得行数的简单方法是:
CSV.read(params[:upcsv][:filename]).length
CSV.foreach(file_path, headers: true).count
上面会在计算行时排除标题
CSV.read(file_path).count
your_csv.count
应该可以解决问题。
只是为了演示IO #readlines的作用:
如果您有这样的文件:“asdflkjasdlkfjsdakf \ n asdfjljdaslkdfjlsadjfasdflkj \ n asldfjksdjfa \ n”
在轨道你会做,说:
file = File.open(File.join(Rails.root, 'lib', 'file.json')) lines_ary = IO.readlines(file) lines_ary.count #=> 3
IO#readlines使用\ n(换行符)作为分隔符将文件转换为字符串数组,就像常用的逗号一样,所以它基本上就像
str.split(/\n/)
事实上,如果你这样做了
x = file.read
这个
x.split(/\n/)
会做与file.readlines相同的事情
**处理具有重复行结构的文件(“child_id”,“parent_ary”,“child_id”,“parent_ary”,…)等时,IO#readlines非常方便
如果您的csv文件不适合内存(不能使用readlines),您可以执行以下操作:
def self.line_count(f) i = 0 CSV.foreach(f) {|_| i += 1} i end
与wc -l
不同,它计算实际记录数,而不是行数。 如果字段值中有新行,则这些可能会有所不同。