【发布时间】:2022-08-13 21:29:11
【问题描述】:
我有以下数据集显示一个人进入新阶段的时间:
| Name | Stage | Amount | Date |
|---|---|---|---|
| Karen | One | $1 | 01/01/21 |
| Karen | Two | $1 | 08/12/21 |
| Karen | Three | $1 | 05/03/22 |
| Jaren | Three | $4 | 02/02/21 |
| Jaren | One | $4 | 07/19/22 |
| Laren | One | $5 | 04/07/21 |
| Laren | Two | $5 | 08/17/22 |
我希望了解各个阶段的人员流动和数量(每人的数量是恒定的)。所以我需要将数据集转换成下表:
| From Stage | To Stage | Amount | Record Count |
|---|---|---|---|
| One | Two | $6 | 2 |
| One | Three | $0 | 0 |
| Two | One | $0 | 0 |
| Two | Three | $1 | 1 |
| Three | One | $4 | 1 |
| Three | Two | $0 | 0 |
我希望仅按人计算金额,并计算从每个阶段转移到另一个阶段的人数(所有可能性)。
-
你能解释更多关于
From Stage和To Stage的信息吗?我仍然不知道如何获得这两列 -
假设有 3 个阶段:一、二、三。一个人可以从任何阶段移动到另一个阶段。这意味着在阶段之间有三种移动方式:一二、一三、二一、二三、三一和三二。这些列是基于时间的这些可能性的表示-因此,Karen 和 Laren 从第一阶段移至第三阶段意味着记录数为 2,数量为 1+5=6。请让我知道这是否有意义。谢谢
标签: python python-3.x pandas dataframe