【发布时间】:2018-05-25 21:21:18
【问题描述】:
我有一个如下所示的数据框:
A B C
0 1 2 PRODUCT_1
1 3 2 PRODUCT_2
2 3 2 PRODUCT_4
3 3 2 PRODUCT_5
4 5 2 PRODUCT_1
5 3 2 PRODUCT_3
我想对每个独特的产品,使用 A 和 B 列执行模型预测,并存储相应的准确度。
unique = ["PRODUCT_1", ...] # unique products
accuracy
for i in unique:
first_subset = ??? # all rows for product `i` - how do I implement this correctly?
X = first_subset[:, 0]
Y = first_subset[:, 1]
prediction_product_1 = model.predict(X)
accuracy_product_1 = np.sum( (prediction_product_1)/np.sum(Y) )
accuracy.append([accuracy_product_1, PRODUCT_1])
如何在 Python 中实现第二点?
【问题讨论】:
-
您的代码在哪里苦苦挣扎?
-
仔细查看
df.groupby。这会为每个唯一键生成组或更小的DataFrames -
我无法正确初始化循环并为最后一点创建框架,因为我不是高级编码员@cᴏʟᴅsᴘᴇᴇᴅ
-
好的,你不能至少提供一个minimal reproducible example 与样本数据和输出吗?你正在和熊猫一起工作,不是吗?您如何在不提供任何信息的情况下获得答案?
-
here 是针对明确问题的更多提示
标签: python pandas group-by unique