【发布时间】:2019-01-24 13:48:02
【问题描述】:
如何计算 DataFrame 中的每个组,然后将组计数附加到 Summary DataFrame 中?
我对 Python 很陌生
我设置了一个空的DataFrame
Counts_data=pd.DataFrame(columns=['filename','Green','Stubble','Baresoil','Stones','Shadow'])
然后我开始一个 For 循环遍历图像 在循环内部,我创建了一个 RGBgroups 的 DataFrame。(通过 knn 模型从像素 RGB 预测的结果)
df_img_pred=pd.DataFrame(knn.predict(df_img_data),columns=['RGBgroup'])
print(df_img_pred.head())
Img_counts=df_img_pred.stack().value_counts()
输出是
RGBgroup
0 BareSoil
1 Stubble
2 Stubble
3 Stubble
4 BareSoil
BareSoil 56507
Stubble 52751
Shadow 5030
Stones 4267
Green 245
dtype: int64
我想计算每个组并将结果与图像的文件名一起附加到“Counts_data”数据框中。我尝试了多种过滤、计数和追加的方法,但我无法让它发挥作用。
任何帮助将不胜感激。
【问题讨论】:
-
请提供最少的数据 (csv)。见this guide。
-
如何附加文件?
-
您不需要附加文件。发布一个最小的文本表格,以便我们了解您的数据是什么样的。
-
RGBgroup 0 茬 1 BareSoil 2 茬 3 茬 4 BareSoil 5 BareSoil 6 BareSoil 7 茬 8 BareSoil 9 茬 10 茬 11 茬 12 茬 13 BareSoil 14 BareSoil 15 茬 16 茬 19 茬 18 茬是前 2 行数据。这个文件只有 Stubble 和 Baresoil,还可能有 Green、Stones 和 Shadow。总行数为 118800。谢谢
-
你能看懂这个吗?我不能。