【问题标题】:Bigquery: Logistic regression issueBigquery:逻辑回归问题
【发布时间】:2018-10-22 06:08:37
【问题描述】:

在使用 Google 的大查询进行 Kaggle 流失预测时,我遇到了以下问题。请帮忙

运行大查询后出现的错误:

“逻辑回归需要至少 2 个唯一标签,而标签列只有 1 个唯一标签”。

正在使用的 Bigquery 命令:

CREATE or REPLACE MODEL 'churndataset.mymodel` 
OPTIONS(model_type = 'logistic_reg'

   , labels= ['Churn'])

   AS
SELECT 

    * EXCEPT(customerID)
FROM 'churndataset.Churn_table` LIMIT 1000  

`

数据集中的流失列(特征)只有“是”或“否”值。

  1. 如果我必须将值更改为“0”或“1”而不是“是”或“否”,请告诉我

  2. 如何让 Bigquery 了解 Churn 有 2 个唯一标签而不是一个?

从 Bigquery 表中,我可以看到 Churn 被检测为布尔变量。

请帮忙。

【问题讨论】:

  • 你有 LIMIT 1000 - 所以很可能在这 1000 个“选定”行中,流失列只有一个值
  • 这是一个公共数据集吗?我想这是因为它是 Kaggle。如果您将其上传到 BigQuery,可以将其公开吗?
  • 消除限制 1000 已解决该问题。谢谢米哈伊尔。

标签: google-bigquery


【解决方案1】:

您必须消除 LIMIT 1000 才能解决您的问题。

【讨论】:

    猜你喜欢
    • 2015-04-18
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-07-08
    • 2020-07-03
    • 2021-09-25
    • 2020-01-31
    • 2020-10-19
    相关资源
    最近更新 更多