【发布时间】:2017-02-15 09:41:03
【问题描述】:
我正在寻找一种方法来生成关于我的模型预测的一些统计信息。 左边我有真实的价值观,右边我有预测。 我的真实值在一个区间内,所以我想将它们浓缩为每个区间的单个值,并知道做出了哪些预测。 我想我需要对第一列执行类似“uniq”的操作,并迭代第二列的每一行,直到第一列中的值发生变化。 我想 awk 会非常擅长使用 $1 和 $2 来处理列,但是第二列的迭代而不丢失第一列中的信息是我卡住的地方。值得注意的是,第一列中的值可能会出现多次,我希望它们在每个间隔中重复,而不是按顺序重复。 我可以接受任何 shell 或 python 中的代码。
示例输入:
1 1
1 0
1 1
2 2
2 2
1 1
3 3
3 3
3 2
3 3
2 3
2 2
2 1
示例输出:
1 1 0 1
2 2 2
1 1
3 3 3 2 3
2 3 2 1
【问题讨论】:
-
到目前为止你想到了什么?