【发布时间】:2018-03-18 18:33:24
【问题描述】:
假设我有一个列表L=[[a,2],[a,3],[a,4],[b,4],[b,8],[b,9]]
使用 pyspark 我希望能够删除第三个元素,使其看起来像这样:
[a,2]
[a,3]
[b,4]
[b,8]
我是 pyspark 的新手,不知道我应该在这里做什么。
【问题讨论】:
-
我没有看到嵌套列表,我看到的是元组列表。 (b,9) 发生了什么 - 它是最后一个元素,不是第三个,但仍然消失了......
-
和how-to-remove-multiple-indexes-from-a-list-at-the-same-time 和...更多关于列表操作的问题。
-
这是一个 Python 问题,而不是 Spark 问题?
-
为了澄清,我需要它来删除每个组的第三个元素。这里每个组都由嵌套列表的索引定义,因此字母 a 和字母 b。这些操作也将在 RDD 上执行。这意味着我需要使用 pyspark。
标签: python apache-spark pyspark