【发布时间】:2018-10-22 06:08:37
【问题描述】:
在使用 Google 的大查询进行 Kaggle 流失预测时,我遇到了以下问题。请帮忙
运行大查询后出现的错误:
“逻辑回归需要至少 2 个唯一标签,而标签列只有 1 个唯一标签”。
正在使用的 Bigquery 命令:
CREATE or REPLACE MODEL 'churndataset.mymodel`
OPTIONS(model_type = 'logistic_reg'
, labels= ['Churn'])
AS
SELECT
* EXCEPT(customerID)
FROM 'churndataset.Churn_table` LIMIT 1000
`
数据集中的流失列(特征)只有“是”或“否”值。
如果我必须将值更改为“0”或“1”而不是“是”或“否”,请告诉我
如何让 Bigquery 了解 Churn 有 2 个唯一标签而不是一个?
从 Bigquery 表中,我可以看到 Churn 被检测为布尔变量。
请帮忙。
【问题讨论】:
-
你有 LIMIT 1000 - 所以很可能在这 1000 个“选定”行中,流失列只有一个值
-
这是一个公共数据集吗?我想这是因为它是 Kaggle。如果您将其上传到 BigQuery,可以将其公开吗?
-
消除限制 1000 已解决该问题。谢谢米哈伊尔。
标签: google-bigquery