【发布时间】:2018-04-15 12:41:17
【问题描述】:
我有以下 np 数组:
[['ID1', 922.63, 'Product 1'],
['ID1', 1001, 'Product 2'],
['ID1', 800, 'Product 1'],
['ID1', 922.63, 'Product 1'],
['ID1', 1001, 'Product 2'],
['ID2', 800, 'Product 1'],
['ID2', 922.63, 'Product 1'],
['ID2', 1001, 'Product 2'],
['ID3', 800, 'Product 1'],
['ID3', 700.63, 'Product 1'],
['ID3', 1200, 'Product 2'],
['ID3', 850, 'Product 1']]
“第二列”(美元金额)是我关心的。我想构建产品 1 和产品 2 的直方图,但我希望将 bin 的大小调整为 100。我使用的实际数据集有 75K 行,值从 1 美元到 200000 美元不等。我想为这些值自动创建这些“桶”,然后构建一个直方图。
我认为使用 pandas 或 numpy 很容易找到这方面的信息,但我要么是新手,无法理解其他“类似”解决方案,要么就是找不到我要找的东西。看起来应该是直截了当的。
【问题讨论】:
-
每一行是一个字符串或三个单独的列或值,以空格作为分隔符?
-
我认为this question 与您要查找的内容非常相似...
-
@ScottBoston 我真的不确定。它以数据框开始,我将其转换为 'dataset = dataset.values';打印(数据集)
标签: python pandas numpy matplotlib