【问题标题】:Ruby: Manipulate Iterators?Ruby:操作迭代器?
【发布时间】:2011-10-22 01:39:37
【问题描述】:

在创建单向、惰性求值、潜在无限迭代器方面,我在使用 Ruby 时遇到了一些问题。基本上,我尝试像使用 Haskell 列表一样使用 Ruby,在较小程度上使用 Python 生成器。

并不是我不理解它们本身;我只是不知道如何像其他语言一样随便使用它们,而且我也不确定 Ruby 中的哪些方法会在我背后将它们变成数组,将整个序列不必要地卸载到内存中。

是的,我一直在研究 Ruby 参考手册。半个小时其实,用心。或者显然不是。

例如,如果我要实现一个卡片组,它在 Python 中看起来像这样(未经测试):

# Python 3

from itertools import chain, count

face_ranks =
    dict(
        zip(
            ('jack', 'queen', 'king', 'ace'),
            count(11)))

sorted_deck =
    map(
        lambda suit:
            map(
                lambda rank:
                    {
                        'rank' : rank,
                        'suit' : suit
                    },
                chain(
                    range(2, 11),
                    face_ranks.keys())),
        ('clubs', 'diamonds', 'hearts', 'spades'))

那么,我将如何在 Ruby 中做到这一点,完全避免使用数组?请注意,据我所知,上面的代码仅使用元组和生成器:在任何时候都不会像我使用数组那样将整个序列转储到内存中。我可能对上面的代码有误,但你得到了我想要的。

如何链接迭代器(如 Python 的 chain())?如何生成无限范围的迭代器(如 Python 的 count())?如何在不将整个过程转换为数组的情况下将数组添加到迭代器(例如将元组传递给 Python 的 chain())?

我见过一些解决方案,但它们涉及数组或纤维等不必要的复杂性。

在 Python 中,我可以像数组一样简单地操作和处理迭代器。我几乎可以将它们视为 Haskell 列表,这是我最熟悉的,也是我在编码时真正想到的。我对 Ruby 数组不满意,这就是我寻求替代方案帮助的原因。

我已经设法在互联网上找到了有关它的大量信息,但我找不到任何涵盖在 Ruby 中对此类数据结构进行基本操作的信息?有什么帮助吗?

【问题讨论】:

    标签: arrays ruby iterator enumerator


    【解决方案1】:

    Ruby 似乎没有很多内置方法来执行您想要使用枚举器执行的不同操作,但您可以创建自己的方法。这就是我在这里使用 Ruby 1.9 所做的:

    iter.rb

    def get_enums_from_args(args)
      args.collect { |e| e.is_a?(Enumerator) ? e.dup : e.to_enum }
    end
    
    def build(y, &block)
      while true
        y << (begin yield; rescue StopIteration; break; end)
      end
    end
    
    def zip(*args)
      enums = get_enums_from_args args
      Enumerator.new do |y|
        build y do
          enums.collect { |e| e.next }
        end
      end
    end
    
    def chain(*args)
      enums = get_enums_from_args args
      Enumerator.new do |y|
        enums.each do |e|
          build y do
            e.next
          end
        end
      end
    end
    
    def multiply(*args)
      enums = get_enums_from_args args
      duped_enums = enums.collect { |e| e.dup }
      Enumerator.new do |y|
        begin
          while true
            y << (begin; enums.collect { |e| e.peek }; rescue StopIteration; break; end )
    
            index = enums.length - 1
            while true
              begin
                enums[index].next
                enums[index].peek
                break
              rescue StopIteration
                # Some iterator ran out of items.
    
                # If it was the first iterator, we are done,
                raise if index == 0
    
                # If it was a different iterator, reset it
                # and then look at the iterator before it.
                enums[index] = duped_enums[index].dup
                index -= 1
              end
            end
          end
        rescue StopIteration
        end
      end
    end
    

    我使用 rspec 编写了一个规范来测试功能并演示它们的作用:

    iter_spec.rb:

    require_relative 'iter'
    
    describe "zip" do
      it "zips together enumerators" do
        e1 = "Louis".chars
        e2 = "198".chars
        zip(e1,e2).to_a.should == [ ['L','1'], ['o','9'], ['u','8'] ]
      end
    
      it "works with arrays too" do
        zip([1,2], [:a, nil]).to_a.should == [ [1,:a], [2,nil] ]
      end
    end
    
    describe "chain" do
      it "chains enumerators" do
        e1 = "Jon".chars
        e2 = 0..99999999999
        e = chain(e1, e2)
        e.next.should == "J"
        e.next.should == "o"
        e.next.should == "n"
        e.next.should == 0
        e.next.should == 1
      end
    end
    
    describe "multiply" do
      it "multiplies enumerators" do
        e1 = "ABC".chars
        e2 = 1..3
        multiply(e1, e2).to_a.should == [["A", 1], ["A", 2], ["A", 3], ["B", 1], ["B", 2], ["B", 3], ["C", 1], ["C", 2], ["C", 3]]
      end
    
      it "is lazily evalutated" do
        e1 = 0..999999999
        e2 = 1..3
        e = multiply(e1, e2)
        e.next.should == [0, 1]
        e.next.should == [0, 2]
        e.next.should == [0, 3]
        e.next.should == [1, 1]
        e.next.should == [1, 2]
      end
    
      it "resulting enumerator can not be cloned effectively" do
        ranks = chain(2..10, [:jack, :queen, :king, :ace])
        suits = [:clubs, :diamonds, :hearts, :spades]
        cards = multiply(suits, ranks)
        c2 = cards.clone
        cards.next.should == [:clubs, 2]
        c2.next.should == [:clubs, 2]
        c2.next.should == [:clubs, 3]
        c2.next.should == [:clubs, 4]
        c2.next.should == [:clubs, 5]
        cards.next.should == [:clubs, 6]
      end
    
      it "resulting enumerator can not be duplicated after first item is evaluated" do
        ranks = chain(2..10, [:jack, :queen, :king, :ace])
        suits = [:clubs, :diamonds, :hearts, :spades]
        cards = multiply(ranks, suits)
        cards.peek
        lambda { cards.dup }.should raise_error TypeError
      end
    end
    

    如上面的规范所示,这些方法使用惰性求值。

    此外,这里定义的 zipchainmultiply 函数的主要弱点是生成的枚举数不能轻易复制或克隆,因为我们没有编写任何代码来复制枚举参数这些新的普查员所依赖的。您可能需要创建 Enumerator 的子类或创建包含 Enumerable 模块的类或类似的东西以使 dup 正常工作。

    【讨论】:

      【解决方案2】:

      您似乎出于对性能的担忧而避免使用 Ruby 数组,这可能是由于您在其他语言中使用数组的经验。你不必避免使用 Ruby 数组——它们是你在 Ruby 中最接近元组的东西。

      foo = 1, 2, 3, 4
      foo.class       #=> Array
      

      看起来您正在寻找 Range 来代替生成器:

      range = 1..4
      range.class     #=> Range
      range.count     #=> 4
      
      ('a'..'z').each { |letter| letter.do_something }
      

      范围不会转换为数组,但它确实包含 Enumerable,因此您可以使用所有常规枚举数。至于循环/迭代——Ruby 中的原生循环是通过 Enumerable 实现的。 for i in group 实际上是枚举器循环的语法糖(如 .each)。可枚举的方法通常会返回发送者,因此您可以将它们链接起来:

      (1..10).map { |n| n * 2 }.each { |n| print "##{n}" }
      # outputs #2#4#6#8#10#12#14#16#18#20
      # returns an array:
      #=> [2, 4, 6, 8, 10, 12, 14, 16, 18, 20]
      

      我很乐意为您提供有关您的 Python»Ruby 等效项的更具体的答案,但我对 Python 并不熟悉。

      更新

      您可以像这样将范围压缩成一个嵌套数组:

      (1..26).zip('a'..'z') #=> [[1, 'a'], [2, 'b'], ...]
      

      ...但是范围是不可变的。您可以使用(1..5).to_a 将范围转换为数组,或者您可以像上面显示的那样对其进行迭代。如果您要测试包含多个已定义的数据范围,您可以使用几个范围和一个地图:

      allowed = 'a'..'z', 1..100
      input = # whatever
      allowed.each do |range|
        return false unless range.cover? input
      end
      

      当然,您始终可以使用带范围的枚举器动态“生成”值。

      【讨论】:

      • 感谢您的帮助。我正在寻找诸如压缩和附加之类的操作;你能在范围内做这样的事情吗?如果不是,那么在类 Range 数据上执行此类操作的 Ruby 等价物是什么?
      • 嗯......那个压缩示例返回一个数组,这意味着它不可能被懒惰地评估,对吧?这意味着无论我是否想要评估所有结果元素,结果都会被整体计算。这就是我不喜欢数组的原因,但我想知道是否有那个 zip 方法的版本返回一个惰性枚举器而不是一个热切求值的数组?感谢您迄今为止的帮助。
      • 我不确定 zip 的实现细节。如果没有具体的数据,您就无法真正改变数据,或者您实际上只是定义了一个合同,以便根据请求改变数据。 Ruby 的标准库中可能已经为此提供了一些东西,但我不熟悉 Ruby 中的数据处理。您还可以将 Enumerable 包含到您自己的类中,并使用更多涉及的循环来在 Ruby 之上更有效地实现您想要的东西(相对于原生结构)。查看执行大量惰性查询的 ActiveRecord 库,您也可能会收获很多。
      • 我一直在研究 Ruby 的库,似乎虽然 Python 的序列操作函数可以泛化到任何可迭代对象,但 Ruby 已经将很多它们硬编码为特定的序列类型。这实际上真的很令人惊讶......
      【解决方案3】:

      Ruby 中最接近的等价物是Enumerator。它可以让你做惰性生成器。

      【讨论】:

      • 但是 TBH 我不想使用一个成熟的生成器来处理像连接或压缩多个范围这样微不足道的事情。
      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2015-12-10
      • 2015-11-10
      • 1970-01-01
      • 1970-01-01
      • 2016-11-10
      • 2022-12-31
      • 2019-05-19
      相关资源
      最近更新 更多