清澈如初|个性化推荐算法(推荐系统)概要( 十 )
User Collaborative Filtering(User CF) 意义:给用户推荐相似兴趣用户感兴趣的物品 。
举个栗子:在我们读书的时候是否经常问学长学姐该读什么样的书或者下载什么样的论文?学长学姐就会给你推荐 。 在这个栗子中学长学姐和你就属于具有相同爱好的用户群体 , 因为你们具有相同的研究领域 。
那么所以基于用户的协同过滤的算法有两个步骤:
1、找到相似兴趣用户的集合
那么问题来了 , 如何评价相似兴趣用户集合?区别于很多传统做法 , 这里主要采用基于用户行为重合度的方法 , 举例来说 , 如果两个用户的行为具有很高的重合度 , 那么他们具有很高的相似性 。 那么他们可以称为相似兴趣用户集合 。
2、推荐相似用户行为过 , 而该用户并没有行为过的item 。 举个栗子 , 如果我们发现两个用户A、B都非常喜欢足球相关的视频 , 行为重合度极高 。 而用户B经常点击天下足球相关的视频 , 用户A并没有行为 , 那么我们可以推荐天下足球相关的视频给用户A 。
栗子:
User A 可以给User D 推荐b
基于用户的协同过滤算法的步骤
1、计算相似用户的相似度矩阵
相似度公式
N(u)表示用户u有过行为item的集合 。 N(v)表示用户v有过行为item的集合 。
分子是item的重合程度 。 显然重合程度越高 , user越相似 。
分母做了一个归一化 , 物理意义上解释了惩罚了操作过多的用户与其他用户的相似程度 。 因为操作过多的用户对应的item的序列会非常的长 , 造成了与很多的用户都有相似 。 分母除以一个很大的数之后呢 , 就能把相似度得分的数值趋于0.在得到用户相似度矩阵过后 , 我们根据用户的行为点击 , 来完成相似用户的item推荐 。
下面来看公式
表示用户v对item i的行为得分 。 在前面介绍item cf公式的时候 , 我们提到过对于不同的行为 , 我们对用户的行为得分定义不同 。 我们这里将行为得分归一化为1.
表示user u与uer v的相似度得分 。 这里根据用户v来完成对用户u的推荐 。 所以这里要介绍用户v 。 用户v是用户u的前TOP k个的相似用户 。 并且用户v行为过的物品 item i,用户user u 没有行为 。 那么我们便得到了用户u对item i的推荐度得分 。
工业界落地时公式升级1:
理论意义:降低那些异常活跃物品对与用户相似度的贡献
举个栗子解释:
如果某个电商系统中 , User (A) 与User(B)同时购买了《新华字典》 , User (A) 与User(C)同时购买了《机器学习》 , 并且他们都只有这一本书重合 , User (A) 与User(B)、User (A) 与User(C)的重合度都是1 , 显然不合理 , 因为购买《新华字典》并不能十分准确的反映用户的兴趣 , 也许是给家里孩子买 , 换言之《新华字典》的用户倒排会非常的长 , 而购买《机器学习》的用户大概率可以反映他们的兴趣 , 因为这本书的购书群体很窄 , 因此我们需要降低那些很多人购买的在重合度中的贡献 。
分子:基础版本的相似度计算公式当中重合的每一item对整体的贡献都是相同的 。 在升级版中贡献变得不同的 。 u(i)表示对item(i)有过行为的用户集合 , 如果一个item被更多的用户行为过 , 那么它在重合度的贡献越低 。 这也符合我们的认知 。
公式升级2(工业界) 理论意义 , 不同用户对同一item行为的时间段不同应该给予时间惩罚 (因为很多用户不同时间段 , 兴趣是发生变化的 , 比如 , 2个用户都曾经点击过足球类短视频 , 一个用户是近期点击 , 另一个用户是在好几个月之前欧洲杯比赛期间 , 也许在目前时间节点 , 已经不再喜欢足球类短视频了 , 我们在计算用户相似度矩阵的时候 , 假定了用户行为可以反映出用户的兴趣 , 所以我们要给予时间衰减降权)
推荐阅读
- 静默如初|三天三夜舞蹈永不停歇-问问腕表可以7天7夜
- 清澈如初|不是微信好友如何转账?教你两种方法,家里老人都需要
- 曹曦月|终于知道她为啥和金瀚传绯闻,气质清纯如初恋,谁看了会不爱?
- 跳跳糖哪里跑|我长大,你依旧年轻:蒋依依杨颖如初,而他们从母子变姐弟
- 穿搭|33岁宋茜“扮嫩”成功,穿紫色毛衣温柔治愈,气质清纯如初恋
- 旗袍公馆|33岁宋茜“扮嫩”成功,紫色毛衣配半裙温柔治愈,气质清纯如初恋
- 中国临床营养网|【今晚直播】王兴国:减肥方法要个性化,营养师医师有话说!
- 鑫珊时尚|李冰冰扎拳击辫显活力满满 活泼比V眼神清澈动人
- 易昕娱乐|10岁上央视47岁得金鸡影帝,今与妻子恩爱如初,他是国家一级演员
- ZAKER娱乐|嫁大18岁患病丈夫不离不弃,结婚多年恩爱如初,曾是央视最美主持
