【问题标题】:Loop that will create new Pandas.DataFrame column循环将创建新的 Pandas.DataFrame 列
【发布时间】:2013-04-29 09:27:23
【问题描述】:

scikit-learn tutorial here 之后,如果我们有一个Pandas.DataFrame 有一个名为colors 的列,我们如何创建一个循环来循环遍历DataFrame 的所有列(或包含所需列的列表),以便所有类别变量(例如,变量colors 可以具有值blueredpurple)将被len(colors) 虚拟变量列数colors#bluecolors#redcolors#purple 替换?

刚学过python,所以我把我的想法写在一些伪代码中。

尝试(伪代码)

cols_to_process = ['colors']

# Create new columns for dummy variables
// if listings.keyname in cols_to_process:
    // unique_values = list of unique values in listings[col]
    // listings = listings.join(unique_values, axis=1)

# Populate dummy variable columns

# Remove old columns that have dummy variable columns created

【问题讨论】:

    标签: python python-2.7 numpy pandas scikit-learn


    【解决方案1】:

    因此,如果我了解您有一列包含一堆颜色的值,并且您想将这些值全部更改为该列的长度?这将做到这一点:

    df['column_name'] = len(df['column_name'])
    

    如果这不是你想要的,请让你的问题更清楚

    【讨论】:

      【解决方案2】:

      您可以使用pandas.get_dummies 函数来做到这一点:

      >>> import pandas as pd
      >>> pd.get_dummies(listings['color'], 'color')
      

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2013-01-14
        • 2021-11-11
        • 1970-01-01
        • 2017-03-24
        • 2015-12-08
        • 1970-01-01
        相关资源
        最近更新 更多