【发布时间】:2015-04-29 11:19:50
【问题描述】:
我有以下数据 (data_current):
import pandas as pd
import numpy as np
data_current=pd.DataFrame({'medicine':['green tea','fried tomatoes','meditation','meditation'],'disease':['acne','hypertension', 'cancer','lupus']})
data_current
我想要做的是转置其中一列,这样我就不用多行包含相同的药物和不同的疾病,而是为每种药物设置一行,并为疾病设置几列。保持索引尽可能简单也很重要,即 0,1,2... 即我不想将“药物”指定为索引列,因为我会将它合并到其他键上。
所以,我需要得到data_needed
data_needed=pd.DataFrame({'medicine':['green tea','fried tomatoes','meditation'],'disease_1':['acne','hypertension','cancer'], 'disease_2':['np.nan','np.nan','lupus']})
data_needed
【问题讨论】:
-
我们可以假设在您的一般情况下,每种药物不超过 2 种疾病吗?
-
情况参差不齐,有的药只有一种病,有的药有几种,最多说5种