单目标排序比较常见的是CTR(点击率)预估,当然这个C并不一定只能是Click,也可以是其他任何行为 。
比如视频是不是会看完,看完后是不是会收藏,是不是会分享到第三方平台,查看的商品是不是会购买等,这些都可以看成那个可以被预估发生概率的CTR 。
多目标顾名思义就是在排序阶段希望能够满足多个目标,比如视频的点击率+停留时长+完播率,电商的点击率+购买率+客单价 。
知乎的排序模型就是一个多目标模型,有基于点击率的模型,基于收藏率的模型,基于点赞率,基于评论率等一共8个目标 。
排序模型一般用目标值和AUC来进行衡量,目标值就是排序模型最开始的目标,点击率、停留时长、购买率等 。
AUC全称是Area Under Curve,意思是曲线下的面积,这里的曲线就是ROC曲线,这个值在数学上等价于模型把关心的那一类样本排在其他样本前面的概率 。
AUC最大是1,完美结果,0.5就是随机排列,0就是完美地全部排错,当然0也可以变成1,效果最差的其实是0.5左右的 。
评估
这部分主要来源于《推荐系统实践》这本书,篇幅有限,不再展开,后面会单独写一篇文章来看如何评估一个推荐系统的好坏 。
用户满意度
点击率,用户停留时长,转化率等指标 。
预测准确度
分为评分预测和TopN预测 。
评分预测主要是通过RMSE来衡量,即预测评分和真实评分之间的均方根误差 。
TopN预测主要是用召回率和准确率来进行衡量 。
- 召回率=推荐数与有反馈数的交集/有反馈数
- 准确率=推荐数与有反馈数的交集/推荐数
推荐系统能够推荐出来的物品,占总物品集合的比例 。
多样性
描述的是推荐列表中物品两两之间的不相似性,希望尽可能多的覆盖用户的兴趣点 。
新颖性
给用户推荐那些他们以前没有见过的东西 。
惊喜度
给用户的推荐结果是和用户历史上喜欢的物品不相似,但用户却又觉得满意的推荐 。
信任度
增加推荐系统的透明度,让用户知道推荐的理由 。
比如为什么给用户推荐了这个东西,可能是历史基于历史的某次行为,也可能是基于某个好友信息…
实时性
能够实时更新推荐列表,来满足用户行为的变化,能够将新加入系统的物品推荐给用户 。
健壮性
推荐系统抗击作弊的能力 。
商业目标
能否满足商业需求,比如GMV、广告收入等 。
最后
以上就是本文的主要内容,先简单的介绍了一些理论知识,然后介绍了通用的推荐系统架构和流程,之后按照推荐流程的挖掘》召回》排序环节进行展开,最后简单的列举了一些衡量推荐系统好坏的指标 。
整个推荐系统的核心是帮助用户发现潜在的用户-物品或者用户-用户连接,先尽可能全的进行覆盖,再尽可能精准的进行排序 。
主要流程可以总结成下图,分别是挖掘》召回》排序 。

文章插图
下图为微博的推荐系统的整体架构,感兴趣的可以研究一下 。

文章插图
素材来源于《AI时代精准个性化推荐》
下图是微博推荐算法的架构,包括基础层(挖掘)、召回层、排序层,可以结合着上面章节的内容再深入了解下 。

文章插图
素材来源于《AI时代精准个性化推荐》
作者:王家郴 资深产品经理
推荐阅读
- Web前端开发基础,带你认识HTML
- 一文看懂rsync实现ftp数据定时同步过程
- 泡茶 请正确掌握注水方式
- 医疗科技的六位“最强大脑”,带你看清技术与商业未来 | CCF-GAIR 2020
- 公司为节省辞退补偿,逼我辞职怎么办?做好这两件事,掌握主动权
- 茶宠很萌 茶宠养护必须掌握三大要点
- 泡茶时如何掌握茶水比
- 一文看懂docker容器技术架构及其中的各个模块
- 防御性驾驶指什么,该怎么掌握与应用
- 泡我 你懂得掌握火候吗
