在Ruby中将基数为2的数字字符串数组写入二进制文件

我在Ruby中编写了一个简单的霍夫曼编码。 作为输出,我有一个数组,例如:

["010", "1111", "10", "10", "110", "1110", "001", "110", "000", "10", "011"] 

我需要在文件中写入,然后读取它。 我尝试了几种方法:

 IO.binwrite("out.cake", array) 

我得到一个简单的文本文件,而不是二进制。

要么:

 File.open("out.cake", 'wb' ) do |output| array.each do | byte | output.print byte.chr end end 

看起来它的工作原理,但后来我无法将其读入arrays。

我应该使用哪种编码?

我想你可以像下面的代码一样使用Array#packString#unpack

 # Writing a = ["010", "1111", "10", "10", "110", "1110", "001", "110", "000", "10", "011"] File.open("out.cake", 'wb' ) do |output| output.write [a.join].pack("B*") end # Reading s = File.binread("out.cake") bits = s.unpack("B*")[0] # "01011111010110111000111000010011" 

我不知道您阅读结果的首选格式,我知道上述方法效率低下。 但无论如何,你可以从unpack的结果顺序取“0”或“1”来遍历你的霍夫曼树。

如果你想要比特,那么你必须手动打包和解包。 Ruby和任何其他常用语言都不适合你。

您的数组包含字符组的字符串,但您需要构建一个字节数组并将这些字节写入文件。

由此: ["010", "1111", "10", "10", "110", "1110", "001", "110", "000", "10", "011"]

你应该建立这些字节: 01011111 01011011 10001110 00010011

由于它只有四个字节,您可以将它们放入一个32位的数字01011111010110111000111000010011 ,即5F5B8E13hex。

您的代码的两个示例都做了不同的事情。 第一个将Ruby数组的字符串表示写入文件。 第二个写入32个字节,其中每个字节为48 (’0’)或49 (’1’)。

如果需要位,那么输出文件大小应该只有四个字节。

阅读有关位操作以了解如何实现该操作。


这是一份草案。 我没有测试它。 有些事可能是错的。

 a = ["010", "1111", "10", "10", "110", "1110", "001", "110", "000", "10", "011"] # Join all the characters together. Add 7 zeros to the end. bit_sequence = a.join + "0" * 7 # "010111110101101110001110000100110000000" # Split into 8-digit chunks. chunks = bit_sequence.scan(/.{8}/) # ["01011111", "01011011", "10001110", "00010011"] # Convert every chunk into character with the corresponding code. bytes = chunks.map { |chunk| chunk.to_i(2).chr } # ["_", "[", "\x8E", "\x13"] File.open("my_huffman.bin", 'wb' ) do |output| bytes.each { |b| output.write b } end 

注意:当总字符数不能被8整除时,将添加七个零来处理大小写。如果没有这些零, bit_sequence.scan(/.{8}/)将删除剩余的字符。

Interesting Posts