如何在散列数组中找到由多个键分组的最大值?
有这种结构的数据。 将按’c’按升序排列。
[ { 'a' => 1, 'b' => 1, 'c' => 1, 'd' => '?' }, { 'a' => 1, 'b' => 1, 'c' => 2, 'd' => '?' }, { 'a' => 1, 'b' => 1, 'c' => 3, 'd' => '?' }, { 'a' => 1, 'b' => 2, 'c' => 4, 'd' => '?' }, { 'a' => 1, 'b' => 2, 'c' => 5, 'd' => '?' }, { 'a' => 2, 'b' => 1, 'c' => 6, 'd' => '?' }, { 'a' => 2, 'b' => 1, 'c' => 7, 'd' => '?' }, { 'a' => 2, 'b' => 1, 'c' => 8, 'd' => '?' }, { 'a' => 2, 'b' => 2, 'c' => 9, 'd' => '?' }, { 'a' => 2, 'b' => 2, 'c' => 10, 'd' => '?' } ]
想要通过’a’和’b’的每个唯一组合分组的’c’的最大值的数组。
[ { 'a' => 1, 'b' => 1, 'c' => 3, 'd' => '?' }, { 'a' => 1, 'b' => 2, 'c' => 5, 'd' => '?' }, { 'a' => 2, 'b' => 1, 'c' => 8, 'd' => '?' }, { 'a' => 2, 'b' => 2, 'c' => 10, 'd' => '?' } ]
其他键需要保留,但与转换无关。 到目前为止,我能想到的最好的方法是反转数组(因此按’c’降序排序),uniq’a’和’b’,以及反向数组。 但我依赖于uniq_by的实现总是返回找到的第一个唯一项目。 规范没有说明,所以我担心依赖于这种行为,因为它可能在未来的版本中发生变化。 还想知道这可能是一个非常低效的方法。
@data.reverse!.uniq!{|record| [record['a'],record['b']]}.reverse!
有没有更好,更有效的方法来做到这一点? 如果你有更好的方法,你也可以解释一下,而不是只给我一个我可能无法解读的超级讨厌的单行。
这实际上相当容易:
a.group_by { |h| h.values_at("a", "b") }.map { |_, v| v.max_by { |h| h["c"] } }
或者使用更好的格式:
a.group_by do |h| h.values_at("a", "b") end.map do |_, v| v.max_by { |h| h["c"] } end
说明:首先我们使用Enumerable#group_by创建一个Hash
,其中"a"
和"b"
的组合(用Hash#values_at提取)作为键,所有哈希值用该组合作为值。 然后,我们映射此哈希,忽略键并从具有Enumerable#max_by的数组中选择具有"c"
最大值的元素。