【发布时间】:2016-06-04 08:15:45
【问题描述】:
我有一个数据集(约 7000 行),我已在 Pandas 中导入了一些“数据争论”,但我需要一些正确方向的指针才能采取下一步。我的数据如下所示,它是对具有多个子级别的结构的描述。 B、D 和 B 是 A 的子级别。 C 是 B 的子级别。等等……
等级、名称
0, A
1、乙
2、C
1、D
2、电子
3、F
3、G
1、乙
2、C
但我想要类似下面的东西,Name 和 Mother_name 在同一行:
等级、姓名、母名
1、B、A
2、C、B
1、D、A
2、E、D
3、F、E
3、G、E
1、B、A
2、C、B
【问题讨论】:
-
你能完全指定
Name -> Mother_name映射吗(最好用字典)? -
谢谢,但我认为我不能轻松地指定映射(您有什么技巧可以做到这一点吗?)。该列表长约 7000 行,最多 10 个级别。例如,
K可以有孩子D和G。M可以有孩子D和X。第一个示例中D的母亲是K,第二个示例中是X。对不起,如果我的解释令人困惑。 -
我认为你需要回到你的数据模式和这个问题的绘图板上。目前尚不清楚派生列是如何计算的。当问题得到正确表述时,数据框的大小是无关紧要的。
-
数据为产品物料清单。具有多个子组件的组件。顶部组件包含例如“螺栓”和“螺母”,但子组件也可以包含相同种类的螺栓和螺母。这也许可以解释奇怪的数据模式。