【发布时间】:2016-05-27 21:58:20
【问题描述】:
我有一个 pandas 数据框列(数据类型),我想将它分成三列
target_table_df = LoadS_A [['Attribute Name',
'Data Type',
'Primary Key Indicator']]
示例输入 (target_table_df)
Attribute Name Data Type Primary Key Indicator
0 ACC_LIM DECIMAL(18,4) False
1 ACC_NO NUMBER(11,0) False
2 ACC_OPEN_DT DATE False
3 ACCB DECIMAL(18,4) False
4 ACDB DECIMAL(18,4) False
5 AGRMNT_ID NUMBER(11,0) True
6 BRNCH_NUM NUMBER(11,0) False
7 CLRD_BAL DECIMAL(18,4) False
8 CR_INT_ACRD_GRSS DECIMAL(18,4) False
9 CR_INT_ACRD_NET DECIMAL(18,4) False
我的目标是:
- 将“数据类型”重新分配给括号前面的文本
[..如果“数据类型”中存在括号]:
- 创建新列 'Precision' 并分配给第一个逗号分隔 价值
- 创建新列 'Scale' 并分配给第二个逗号分隔值
因此,预期输出将变为:
Data Type Precision Scale
0 decimal 18 4
1 number 11 0
2 date
3 decimal 18 4
4 decimal 18 4
5 number 4 0
我已经愤怒地尝试实现这一点,但我是数据框的新手......如果我要遍历所有行或者是否有办法应用到数据框中的所有值,我无法解决?
非常感谢任何帮助
【问题讨论】:
-
请提供样例输入输出。
-
提供了示例输出。示例输入是标记为“数据类型”值的内容。为任何帮助干杯
标签: python regex parsing pandas dataframe