本文授权转载自Datawhale
禁止二次转载
大家好,我是老表
阅读文本大概需要 5 分钟
这是在图灵联邦社区分享的一期,分别从方法论(思考维度)和套路(tricks)两方面展开,其中涉及到机器学习的方方面面,这里要感谢鹏哥在李开复deepcamp上的分享ppt,里面有一些拾人牙慧。其中就两种比赛讲了一些速推套路,分别是套路很集中的CTR和文本分类。效果就是,你看了这个,学会套路,拿个国内CTR套路赛前10完全没问题,kaggle银牌完全没问题。其实CV的比赛也是如此,有机会可以请seutao来讲一讲。
不过说实话trick是最不值钱的,一学就会,但是大家都藏着掖着,毕竟说出来就不值钱了。思考问题的角度比较重要,防止你漏掉一些东西,然后可以发现一些新的东西。其中有个特别简单的,关于指标优化,KDD CUP 2019 仅仅用这一招就可以从第100名直接提升到第10名。
分别对应着入门-进阶-速推三个层次。有关问题大家可以在评论区讨论,先把ppt放出来来吧。后面慢慢补充以及展开每一部分的内容,每一部分都可以单都讲很久,在图灵联邦上40分钟实在是密度太大了。
这个地方很有意思,KDD CUP 2019 仅仅用这一招就可以从第100名提升到第10名。
这个CTR特征速查表其实有好几页word,这里写了常用的一部分。
配套讲解视频
https://www.bilibili.com/video/av57480953/?p=2
大家好,我是老表
觉得本文不错的话,转发、留言、点赞,是对我最大的支持。
欢迎关注微信公众号:简说Python关注后回复:1024,可以领取学习资源。
每日留言
说说你读完本文感受?
或者一句激励自己的话?
(字数不少于15字)
想进学习交流群
加微信:jjxksa888
备注:简说Python
2小时快速掌握Python基础知识要点。
完整Python基础知识要点
近期推荐阅读:【1】整理了我开始分享学习笔记到现在超过250篇优质文章,涵盖数据分析、爬虫、机器学习等方面,别再说不知道该从哪开始,实战哪里找了【2】【终篇】Pandas中文官方文档:基础用法6(含1-5)
觉得不错就点一下“在看”吧