【发布时间】:2021-11-16 23:14:30
【问题描述】:
我有一个数据框,其示例如下所示。
import pandas as pd
data = {'ID':['A','B','C','D','E','F'],
'Gender':['Man', 'Woman', 'Transgender', 'Non-binary,Transgender', 'Woman,Non-binary',
'Man,Non-binary,Transgender']}
df = pd.DataFrame(data)
df
现在,我想为“性别”列中的每个值创建一列,如果该值存在于该行中,则新列应为“1”,否则为空。所需的最终表格如下所示。
不能使用 pd.get_dummies(),因为在许多行中有多个值(例如:'Non-binary, Transgender')。 我想过对所有值进行手动硬编码,但想知道是否有办法自动化该过程。 任何帮助是极大的赞赏。谢谢。
【问题讨论】:
标签: python pandas dataframe data-science data-processing