【发布时间】:2023-01-17 21:10:04
【问题描述】:
我有包含主题列表(主题 1-6;0 表示未分配主题)及其值的数据。我想为每个主题和每个标签创建一个新列,并用值填充该列。这是桌子的样子......
reviewId topic value label
01 2 -4 negative
02 2 9 positive
03 0 -7 negative
04 5 -1 negative
05 1 38 positive
我应该怎么做才能创建一个看起来像这样的表?
| reviewId | topic | value | label | t1p | t1n | t2p | t2n | t3p | t3n | t4p | t4n | t5p | t5n |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 01 | 2 | -4 | negative | 0 | 0 | 0 | -4 | 0 | 0 | 0 | 0 | 0 | 0 |
| 02 | 2 | 9 | positive | 0 | 0 | 9 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 03 | 0 | -7 | negative | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 04 | 5 | -1 | negative | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | -1 |
| 05 | 1 | 38 | positive | 38 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
这是要处理的可重现数据。
raw_df = pd.DataFrame({
'reviewId': ['01', '02', '03', '04', '05'],
'topic': [2, 2, 0, 5, 1],
'value': ['-4', '9', '-7', '-1', '38']})
这是关于此问题的类似主题的链接..
【问题讨论】:
标签: python pandas dummy-variable