【发布时间】:2014-03-31 21:43:31
【问题描述】:
所以我有大约总共 9 列的 csv 数据。我特别想看 这 9 列中的 4 列(第一、第二、第四和第八),并使用第一和第二来确定要返回这些列中的哪些行。
所以我的数据看起来像这样(几行)
col 1 col 2 col 4 col 8
0 -4 19 21
0 5 16 18
1 5 17 3
1 7 5 4
1 9 6 5
2 0 13 7
3 12 14 6
3 -12 7 8
我想要做的是第 1 列中的每个唯一值(0、1、2、3 等......)我想查看第 2 列并找到最小值(我也必须这样做最大,但类似的想法)在该列中,并为列 1 中的每个数字返回列 2 中具有最小数字的行。
到目前为止,我所拥有的是:
data = np.loadtxt(filenm, skiprows = 1, dtype = float, delimiter = ',')
unique = np.unique(data[:,0])
我现在几乎不知道该怎么做。我试图搜索 col 1 中的每个唯一值,但我不知道如何根据 col2 中的每个值来执行此操作。我知道在熊猫上完成这项工作的方法,但我特别想用 numpy 做一些事情
【问题讨论】:
-
“我知道在 panda 上完成这项工作的方法,但我特别想用 numpy 做一些事情”。作为一个多年来几乎每个工作日都使用
numpy的人说话:为什么? -
也许是因为我正在尝试不同的方法,而且这是我正在为其他人整理我需要完成的任务的一部分。它基本上是一种尝试学习 numpy 来做这些事情的方法,而不是其他方法,最终目标是学习这些东西,实际数据本身只是作业的一部分。