Iterator::collect 函数是如何工作的？答案

【问题标题】：How does the Iterator::collect function work?Iterator::collect 函数是如何工作的？
【发布时间】：2020-04-18 07:18:35
【问题描述】：

我试图通过some documentation 了解collect 函数的全部功能。我遇到了一些挑战，特别是在页面上引用的最后一个示例中（也在下面列出，我的 cmets 内联）

let results = [Ok(1), Err("nope"), Ok(3), Err("bad")];

let result: Result<Vec<_>, &str> = results.iter().cloned().collect();

// gives us the first error <-- Point 1
assert_eq!(Err("nope"), result);

let results = [Ok(1), Ok(3)];

let result: Result<Vec<_>, &str> = results.iter().cloned().collect();

// gives us the list of answers
assert_eq!(Ok(vec![1, 3]), result);

我用我自己的一些代码跟进了这段代码（如下所示）

let results: [std::result::Result<i32, &str>; 2] = [Err("nope"), Err("bad")];

let result: Vec<Result<i32, &str>> = results.iter().cloned().collect();

// The following prints <-- Point 2
// "nope"
// "bad"
for x in result{
    println!("{:?}", x.unwrap_err());
}

查看the FromIterator trait on the Result struct的实现，我们看到它提到“获取Iterator中的每个元素：如果是Err，则不获取更多元素，并返回Err。如果没有出现Err，则返回一个包含每个Result 值的容器。

此解释与在第 1 点看到的结果一致，但似乎不适用于第 2 点。在第 2 点中，我希望只打印“nope”而不是两个值。

因此，我试图了解这种（选择性）转换发生在哪里并遇到了挑战。

如果我们查看方法定义本身，我们会看到以下内容。

#[inline]
fn from_iter<I: IntoIterator<Item=Result<A, E>>>(iter: I) -> Result<V, E> {
    // FIXME(#11084): This could be replaced with Iterator::scan when this
    // performance bug is closed.

    iter::process_results(iter.into_iter(), |i| i.collect())
}

这表明into_iter() 方法正在迭代器上被调用。搜索into_iter 给出了两种实现

#[stable(feature = "rust1", since = "1.0.0")]
impl<T, E> IntoIterator for Result<T, E> {
    type Item = T;
    type IntoIter = IntoIter<T>;

    /// Returns a consuming iterator over the possibly contained value.
    ///
    /// The iterator yields one value if the result is [`Result::Ok`], otherwise none.
    ///
    /// # Examples
    ///
    /// Basic usage:
    ///
    /// ```
    /// let x: Result<u32, &str> = Ok(5);
    /// let v: Vec<u32> = x.into_iter().collect();
    /// assert_eq!(v, [5]);
    ///
    /// let x: Result<u32, &str> = Err("nothing!");
    /// let v: Vec<u32> = x.into_iter().collect();
    /// assert_eq!(v, []);
    /// ```
    #[inline]
    fn into_iter(self) -> IntoIter<T> {
        IntoIter { inner: self.ok() }
    }
}

#[stable(since = "1.4.0", feature = "result_iter")]
impl<'a, T, E> IntoIterator for &'a Result<T, E> {
    type Item = &'a T;
    type IntoIter = Iter<'a, T>;

    fn into_iter(self) -> Iter<'a, T> {
        self.iter()
    }
}

但是，以我对语言的有限理解，似乎没有人能够解释文档所说的内容以及第 2 点中发生的情况。

有人可以解释一下这是如何工作的，或者可以指出我在源代码中实现这种选择逻辑的正确位置吗？

我想了解的不是为什么我们在一个向量中得到所有值而在结果中只有一个值，而是 a.从值列表和 b 中选择第一个 Err 的代码/逻辑在哪里？为什么在将结果收集在列表中时选择多个 Err 值（根据文档，它应该只是第一个 Err 值）

【问题讨论】：

from_iter 不仅仅是打电话给into_iter()。你查过iter::process_results的定义吗？
@BenjaminLindley 你能告诉我 process_results 的实现吗？
github.com/rust-lang/rust/blob/master/src/libcore/iter/adapters/…

标签： rust iterator documentation collect

【解决方案1】：

在这个例子中

let result: Vec<Result<i32, &str>> = results.iter().cloned().collect();

您不会收集到Result，而是收集到Vec，因此所有值都被收集，不受影响。预计来自Vec。

这和

有根本的不同

let result: Result<Vec<_>, &str> = results.iter().cloned().collect();

您收集到Result 的位置，它会根据是否找到Err 来过滤元素。这来自impl<A, E, V> FromIterator<Result<A, E>> for Result<V, E> where V: FromIterator<A>,。

【讨论】：

谢谢，但我想了解的不是为什么我们在一个向量中获得所有值而在结果中只有一个值，而是一个。从值列表和 b 中选择第一个 Err 的代码/逻辑在哪里？为什么在将结果收集在列表中时选择多个 Err 值（根据文档，它应该只是第一个 Err 值）。我还将修改问题以使其清楚。
@LateNighter “我想了解的不是为什么我们在一个向量中得到所有值而在结果中只有一个值，”你有多少个？

【解决方案2】：

Iterator::collect 定义为：

fn collect<B: FromIterator<Self::Item>>(self) -> B
where
    Self: Sized,
{
    FromIterator::from_iter(self)
}

所有有趣的实现都是通过FromIterator trait 完成的。每种类型都可以选择如何实现这个 trait。

Result 和 Vec 的实现都经过优化和抽象，因此指向一行代码并说“这就是它的位置”并非易事。

`Result`

这会调用iter::process_results，这是一个用于“提升”Results 的迭代器的内部辅助方法（您可以在Itertools::process_results 中看到类似的内容）。如果遇到任何Result::Err，则迭代会因该错误而停止。否则，使用仅包含成功值的迭代器执行闭包。闭包在内部集合类型上调用Iterator::collect，生成成功值的Vec。

`Vec`

这通过 SpecFromIter 辅助特性执行一些内部特化间接。完成所有这些操作后，您会看到创建了一个空的 Vec，然后 extended 包含迭代器中的所有项目。

【讨论】：