1.推荐系统
推荐系统是我们日常使用App中最常用的功能,面向没有明确需求的人。帮助用户在海量数据中,根据用户的历史信息和行为,向用户推荐她感兴趣的内容。
1.基于行为的协同过滤
你看了钢铁侠,看过钢铁侠的人也喜欢看蝙蝠侠,那就把蝙蝠侠推荐给你。
你的好友看了钢铁侠,也会给你推荐钢铁侠。
2.基于内容相似推荐
你看了钢铁侠和蝙蝠侠,会打上科幻的标签,把具有同样标签的绿巨人推荐给你。
2.推荐系统作用
1.信息过载
帮助用户找到自己感兴趣的物品;
帮助系统或商家精准找到目标用户,达到商业目的;
2.挖掘长尾
一定程度上提高冷门物品的曝光
更好的将用户User和物品Item连接起来
3.推荐环节
1.召回:巨大数据量召回,亿级别,协同过滤,内容相似召回
2.排序:
3.调整:去重过滤、分页、填充信息
4.推荐架构
数据的生命周期
1.数据源:数据接入、日志分析、各种表库
2.数据采集:Kafka
3.数据存储:HDFS
4.数据计算:MapReduce、Spark、Flink(流式数据)
5.数据应用:推荐、搜索、报表
推荐架构
1.API层:将外来请求解析为统一格式,并根据展位编码将请求转发到对应的逻辑层处理。
2.逻辑层:处理不同类型的推荐请求,将响应结果封装成各展位需要的格式;完成补充商品信息、过滤、分页、缓存、埋码等功能、支持AB测试。
3.模型层:根据逻辑层的的请求数据,构建各种数据模型。
4.数据层:存储用户行为数据及各种模型数据。
5.用户画像
标签类别:
原始数据:行为日志 购买历史 收藏商品
事实标签:生日 年龄 收货地址
模型标签:活跃度 消费能力 品牌偏好
预测标签:猜你喜欢品牌、品类
6.推荐效果
满意度
准确度:被打上正确标签的用户比例
覆盖率
多样性
新颖性
惊喜度