利用Python简单实现网易云用户算法推荐系统( 三 ) 笔者最近面试到了网易新闻推荐部门

1.针对用户推荐网易云音乐(每日30首歌/7首歌) 2.针对歌曲在你听某首歌的时候，找“相似歌曲”
7. Surprise推荐库简单介绍在推荐系统的建模过程中，我们将用到python库 Surprise(Simple Python RecommendatIon System Engine) ，是scikit系列中的一个(很多同学用过scikit-learn和scikit-image等库) 。
具体的配合这篇博文（Python推荐系统库——Surprise）深入学习Surprise 。
8. 网易云音乐歌单推荐利用surprise推荐库中KNN协同过滤算法进行已有数据的建模，并且推荐相似的歌单预测
# -*- coding:utf-8-*-"""利用surprise推荐库 KNN协同过滤算法推荐网易云歌单python2.7环境"""from __future__ import (absolute_import, division, print_function, unicode_literals)import osimport csvfrom surprise import KNNBaseline, Reader, KNNBasic, KNNWithMeans,evaluatefrom surprise import Datasetdef recommend_model():file_path = os.path.expanduser('neteasy_playlist_recommend_data.csv')# 指定文件格式reader = Reader(line_format='user item rating timestamp', sep=',')# 从文件读取数据music_data = http://kandian.youth.cn/index/Dataset.load_from_file(file_path, reader=reader)# 计算歌曲和歌曲之间的相似度train_set = music_data.build_full_trainset()print('开始使用协同过滤算法训练推荐模型...')algo = KNNBasic()algo.fit(train_set)return algodef playlist_data_preprocessing():csv_reader = csv.reader(open('neteasy_playlist_id_to_name_data.csv'))id_name_dic = {}name_id_dic = {}for row in csv_reader:id_name_dic[row[0]] = row[1]name_id_dic[row[1]] = row[0]return id_name_dic, name_id_dicdef song_data_preprocessing():csv_reader = csv.reader(open('neteasy_song_id_to_name_data.csv'))id_name_dic = {}name_id_dic = {}for row in csv_reader:id_name_dic[row[0]] = row[1]name_id_dic[row[1]] = row[0]return id_name_dic, name_id_dicdef playlist_recommend_main():print("加载歌单id到歌单名的字典映射...")print("加载歌单名到歌单id的字典映射...")id_name_dic, name_id_dic = playlist_data_preprocessing()print("字典映射成功...")print('构建数据集...')algo = recommend_model()print('模型训练结束...')current_playlist_id = id_name_dic.keys()[200]print('当前的歌单id：' + current_playlist_id)current_playlist_name = id_name_dic[current_playlist_id]print('当前的歌单名字：' + current_playlist_name)playlist_inner_id = algo.trainset.to_inner_uid(current_playlist_id)print('当前的歌单内部id：' + str(playlist_inner_id))playlist_neighbors = algo.get_neighbors(playlist_inner_id, k=10)playlist_neighbors_id = (algo.trainset.to_raw_uid(inner_id) for inner_id in playlist_neighbors)# 把歌曲id转成歌曲名字playlist_neighbors_name = (id_name_dic[playlist_id] for playlist_id in playlist_neighbors_id)print("和歌单<", current_playlist_name, '> 最接近的10个歌单为：\n')for playlist_name in playlist_neighbors_name:print(playlist_name, name_id_dic[playlist_name])playlist_recommend_main()# "E:\ProgramingSoftware\PyCharm Community Edition 2016.2.3\Anaconda2\python2.exe" C:/Users/Administrator/Desktop/博客素材/recommend_system_learning/recommend_main.py# 加载歌单id到歌单名的字典映射...# 加载歌单名到歌单id的字典映射...# 字典映射成功...# 构建数据集...# 开始使用协同过滤算法训练推荐模型...# Computing the msd similarity matrix...# Done computing similarity matrix.# 模型训练结束...# 当前的歌单id：2056644233# 当前的歌单名字：暖阳微醺◎来碗甜度100%的糖水吧# 当前的歌单内部id：444# 和歌单


上一页
1
2
3
4
下一页
		  	






























推荐阅读

           
                  
              
                  强调安全生产的诗句?关于安全生产的古诗四句 
                
                   
                
              
            

                  
              
                  情感调解|小姑子借了30万赖着不还，上门讨要惹恼婆婆，差点结束8年婚姻 
                
                   
                
              
            

                  
              
                  影迷宝爸给女儿取名“子怡”，还沾沾自喜，媳妇发飙倒着念试试 
                
                   
                
              
            

                  
              
                  住院|意大利单日新冠病亡人数创新低 
                
                   
                
              
            

                  
              
                  海航三亚飞北京航班风挡裂纹返航：未造成客舱失压 
                
                   
                
              
            

                  
              
                  岳云鹏|岳云鹏雷佳音“极挑”抱团《未知的餐桌》变跑挑相争 
                
                   
                
              
            

                  
              
                  使用物联网降低维护成本的四种策略 
                
                   
                
              
            

                  
              
                  藏红花泡水喝的功效,藏红花泡水喝的功效与作用及禁忌 
                
                   
                
              
            

                  
              
                  『减重』胃旁路手术治疗肥胖型2型糖尿病效果怎么样 
                
                   
                
              
            

                  
              
                  孕妇吃了胡椒粉怎么办 
                
                   
                
              
            

                  
              
                  中国新闻网|进博声音：中国对外投资规模将持续扩大 
                
                   
                
              
            

                  
              
                  工人日报|中国冰淇淋市场总量超千亿元 还有哪些机会可挖掘？ 
                
                   
                
              
            

                  
              
                  北青网综合|硬核！路边消防栓爆裂狂喷水，小伙一屁股坐下，人肉压水花 
                
                   
                
              
            

                  
              
                  『iPhone』2000预算手机怎么选，96%以上的人都会选择这四款 
                
                   
                
              
            

                  
              
                  乐居网|外出最好带雨具，今入末伏暑渐消 
                
                   
                
              
            

                  
              
                  特朗普：何时由媒体宣布下任总统？-特朗普还有戏吗-美国大选2020结果公布时间 
                
                   
                
              
            

                  
              
                  [神奇的老外]澳洲虐待狂把折磨年轻女子当娱乐&nbsp;逼其吞食呕吐物&nbsp;用丙酮烟头烧她 
                
                   
                
              
            

                  
              
                  茜茜看星座|格林为詹姆斯回怼皮尔斯,事实上,格林和詹姆斯的关系比想象中好 
                
                   
                
              
            

                  
              
                  『婴儿腹泻便秘』婴儿腹泻便秘吃这个最管用 
                
                   
                
              
            

                  
              
                  都市民生汇|被阻后用英文回怼，惹怒网友：装什么外国人，女子地铁乱吐瓜子 
                
                   
                
              
            

          

大一非计算机专业的学生，如何利用寒假自学C语言 

计算机专业大一下学期，该选择学习Java还是Python 

TikTok推出首个利用iPhone 12 Pro LiDAR技术的AR特效 

想自学Python来开发爬虫，需要按照哪几个阶段制定学习计划 

未来想进入AI领域，该学习Python还是Java大数据开发 

1个手机怎么登录2个微信？方法很简单，看完我学会了 

中消协点名大数据网络杀熟 反对利用消费者个人数据画像 

原来华为手机拍视频还能添加字幕，方法很简单，一学就会 

Lip Factory利用人工智能现场为顾客创建定制口红 

手机照片、视频怎样添加文字？原来很简单，4种方法一分钟搞定

利用Python简单实现网易云用户算法推荐系统( 三 )

推荐阅读

强调安全生产的诗句?关于安全生产的古诗四句

情感调解|小姑子借了30万赖着不还，上门讨要惹恼婆婆，差点结束8年婚姻

影迷宝爸给女儿取名“子怡”，还沾沾自喜，媳妇发飙倒着念试试

住院|意大利单日新冠病亡人数创新低

海航三亚飞北京航班风挡裂纹返航：未造成客舱失压

岳云鹏|岳云鹏雷佳音“极挑”抱团《未知的餐桌》变跑挑相争

使用物联网降低维护成本的四种策略

藏红花泡水喝的功效,藏红花泡水喝的功效与作用及禁忌

『减重』胃旁路手术治疗肥胖型2型糖尿病效果怎么样

孕妇吃了胡椒粉怎么办

中国新闻网|进博声音：中国对外投资规模将持续扩大

工人日报|中国冰淇淋市场总量超千亿元还有哪些机会可挖掘？

北青网综合|硬核！路边消防栓爆裂狂喷水，小伙一屁股坐下，人肉压水花

『iPhone』2000预算手机怎么选，96%以上的人都会选择这四款

乐居网|外出最好带雨具，今入末伏暑渐消

特朗普：何时由媒体宣布下任总统？-特朗普还有戏吗-美国大选2020结果公布时间

[神奇的老外]澳洲虐待狂把折磨年轻女子当娱乐 逼其吞食呕吐物 用丙酮烟头烧她

茜茜看星座|格林为詹姆斯回怼皮尔斯,事实上,格林和詹姆斯的关系比想象中好

『婴儿腹泻便秘』婴儿腹泻便秘吃这个最管用

都市民生汇|被阻后用英文回怼，惹怒网友：装什么外国人，女子地铁乱吐瓜子