任务1: 赛题理解
赛题概况:
根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款。来自某信贷平台的贷款记录,数据量超过120万条。47个变量信息,其中15列为匿名变量。80万条作为训练集,20万条作为测试集A, 20万条作为测试集B.同时会对employmentTitle、purpose、postCode和title等信息进行脱敏。
- 正式赛(9月5日-11月12日)
- 长期赛(11月16日之后)
参赛须知:
赛制介绍:比赛行业背景,要解决的问题,比赛的时间安排,奖金池,主办方等信息。
赛题与数据: 详细介绍赛题与提供的数据,比赛过程中会根据赛季安排提供不同阶段的数据。
FAQ:比赛过程中通用性问题更新
排行榜:当前赛季最优的成绩和队伍展示
技术圈:点击后能看到其他在玩这个比赛的人在分享什么。
提交结果:当接近评测时间时,提交结果的按钮会显示,进入后根据比赛要求提交结果。
我的团队:组队家人或者加入其他队伍的入口。
大赛奖励
冠军:一支队伍
亚军:一支队伍
季军:一支队伍
优胜奖:10支队伍
(排名以11月12日晚上20点排行榜所示为准)
大赛组织
Datawhale & 天池
数据概况
了解比赛列的性质会有助于我们对数据的理解和后续分析。 匿名特征表示未告知所属的性质的特征列。