【发布时间】:2021-06-12 23:28:30
【问题描述】:
df = pd.DataFrame({"col_a": [1,2,3], "col_b": [5,4,0], "col_c": [9,7,6])
cols = [["col_a", "col_b"],["col_c", "col_b"],["col_a", "col_b"]]
#expected output:[[1,5],[7,4],[3,0]]
我知道这可以使用列表理解来实现,因为我有超过百万条记录,所以我正在寻找更有效的方法
【问题讨论】:
-
因此循环超过 100 万条记录大约需要 1 秒。你需要重复运行这个吗?
-
你能更明确地说明你想要做什么吗?甚至可能显示列表理解。我猜测你是
zipping虽然cols和df的行,并使用它从df的连续行中选择值。
标签: python pandas dataframe numpy vectorization