【问题标题】:How to edit the data to get a good result for prediction?如何编辑数据以获得良好的预测结果?
【发布时间】:2021-12-28 04:12:50
【问题描述】:

我有一个 DataFrame,我想使用线性回归预测每个用户的收入 . 我的分数太差了,我认为这是因为编程语言列(我对所有数据进行了编码),但这种方式并不好。 如何让编程语言栏目做得更好?

【问题讨论】:

    标签: python pandas machine-learning regression linear-regression


    【解决方案1】:

    您可以为每种编程语言创建一个额外的列。列类型将为布尔值 - 用户是否使用此编程语言。

    您可以如何执行此操作的选项之一:

    df['Python'] = df['The_programming_languages_you_use'].apply(lambda languages: 'Python' in languages)
    df['Go'] = df['The_programming_languages_you_use'].apply(lambda languages: 'Go' in languages)
    

    【讨论】:

      猜你喜欢
      • 2020-11-07
      • 2020-05-07
      • 2021-10-31
      • 2013-05-23
      • 1970-01-01
      • 2011-04-15
      • 2014-05-17
      • 1970-01-01
      • 2010-11-02
      相关资源
      最近更新 更多