关系经济人类预测化学自然
投稿投诉
自然科学
知识物理
化学生物
地理解释
预测理解
本质社会
人类现象
行为研究
经济政治
心理结构
关系指导
人文遗产

网易云音乐分析之推荐算法

6月22日 多上心投稿
  文章从网易云音乐的推荐功能出发,为我们分享了互联网的常用推荐策略。
  在上一篇文章中我们对网易云音乐的核心功能音乐推荐进行了简单分析,时隔三个月,从appstore等评分中可以看出,部分用户对网易云音乐推荐曲目的准确度存在质疑。本篇文章我们从网易云音乐的推荐功能出发,结合我的实习工作,聊一聊互联网的常用推荐策略。
  网易云音乐推荐
  首先来回顾一下云音乐的推荐功能。音乐推荐是创始人丁磊先生愿景最直接的体现,也是网易云音乐的主推功能和核心竞争力所在,备受用户推崇。
  推荐算法简单说就是在海量的用户数据(行为记录等)中对用户进行划分,对同一群体的用户推荐其他用户喜欢的音乐。这其中需要给音乐分类并建立评分细则、建立用户模型、寻找相似用户。基于用户的行为数据将歌曲分类匹配实现盲听。
  网易云将音乐推荐分成三个部分:私人FM、每日歌曲推荐、推荐歌单。
  (1)从准确性、多样性角度分析
  私人FM(准确性低、多样性高):多样性高能为用户带来新鲜感,如果发现了一首从未听过但特别喜欢的歌,会带来惊喜感,调动用户正面情绪。可是由于准确性低,很可能新歌很不被用户喜欢,所以在私人FM在播放界面设置删除、下一首两个按键便于用户切换歌曲。
  每日歌曲推荐(准确性高、多样性低):准确性高使得每日推荐的20首歌曲比较好的满足用户口味,但是存在音乐类型单一化的问题,因此设置了播放列表以提供用户浏览、操作的权利,弥补曲目单一化带给用户的失望。
  推荐歌单(准确性中、多样性中):推荐歌单有别于其他两个个性化推荐功能,它准确性多样性的阈值不只是由算法决定的,更多的是它功能形式所决定的,首先把功能的面向对象分为两类,一类是用户,一类是UGC歌单,系统分别为歌单和用户加标签以提高准确度,由于UGC歌单是由很多用户创建,所以UGC歌单就具有多样性,两者糅合从而保证了准确度和多样性共存。
  (2)从操作流程上分析
  三个功能从看见功能按键到最终获得推荐曲目的步骤:
  看见私人FM点击私人FM获取音乐
  看见每日歌曲推荐点击每日歌曲推荐看见推荐列表筛选喜欢曲目点击喜欢曲目获取音乐
  看见推荐歌单点击推荐歌单跳转歌单页面发现类型标签筛选类型标签点击类型标签看见标签下的推荐歌单筛选歌单点击歌单浏览歌单列表筛选喜欢歌曲点击喜欢歌曲获取音乐
  可以发现三种方式获取推荐音乐的操作流程由简入繁。
  (3)从用户使用阶段分析
  三个功能对应着三种用户阶段:
  私人FM新用户:私人FM位于首页黄金位置,新用户初次体验的产品功能时大概率点击这个按键,所以要简化用户使用流程,用户在快速感受产品个性化推荐的魅力后才产生继续了解其他功能的欲望。
  每日歌曲推荐普通用户:新用户使用私人FM过后需要不一样的体验来满足个性化需求,每日20首歌曲推荐对用户来说是可预知的,20首上限的设定给用户物以稀为贵的感觉,会珍惜每日的推荐,而每日更新无法回看以往推荐的设定,会让用户觉得一天不看就错过了什么的紧迫感。推荐算法设定了基于不同用户行为的权重,下载最高,收藏、搜索、分享其次,此外你也可以点击不感兴趣,或许会避开这类歌。
  推荐歌单深度用户:歌单是云音乐连接个性化推荐和社交的重要桥梁,推荐歌单是个性化推荐功能最后一环,在深度体验了推荐歌单之后,用户会得到歌单可被分享和推荐的认识,很可能会产生自建歌单的冲动,而歌单在云音乐中具有社交属性,用户可以互相收藏、评论、分享歌单,而且歌单在个人主页中也反映了个人音乐风格,让用户能够更好地展现自己给他人。
  (4)从参与元素分析
  私人FM:系统
  每日歌曲推荐:系统自己
  推荐歌单:系统自己其他用户
  欧氏距离vs余弦相似度
  在线下导购时代,导购员会通过系统的话术掌握消费者的情况,来推荐商品。类比导购员推销时的思维逻辑,我们可以得到音乐推荐算法需要解决的三个核心问题:
  将用户信息转化为用户类型;
  了解曲目的归属类型;
  将不同类型的用户与不同类型的曲目对应;
  我们怎么量化两个事物之间的相似度呢?常见的方法是利用欧式距离和余弦相似度。以A、B用户间相似度为例:
  利用欧式距离时,我们把A、B用户看做两点,用两点间距离表示二者相似度。
  使用余弦相似度时,则把二者看成同一坐标系下的两个向量。两个向量间夹角大小反应出他们的相似度,夹角越小则相似度越大。二维空间向量表示为r(x1,x2),多维空间向量表示为r(x1,x2,xn)
  比如,假设用户有5个维度
  对流行的喜欢程度(15分),对摇滚的喜欢程度(15分),对民谣的喜欢程度(15分),对说唱的喜欢程度(15分),对爵士的喜欢程度(15分)。
  用户A:对流行的喜欢程度3,对摇滚的喜欢程度1,对民谣的喜欢程度4,对说唱的喜欢程度5,对爵士的喜欢程度0,用户A可以用向量表示为rA(3,1,4,5,0)
  一个用户B:对流行的喜欢程度3,对摇滚的喜欢程度4,对民谣的喜欢程度5,对说唱的喜欢程度0,对爵士的喜欢程度2,用户B可以用向量表示为rB(3,4,5,0,2)
  对于向量A和B而言,他们的在多维空间的夹角可以用向量余弦公式计算:
  余弦相似度取值在0到1之间,0代表完全蒸饺,1代表完全一致。那么用户A和B的相似度计算:
  即代表了两个用户音乐偏好的相似程度。
  余弦相似度是一种很好的数据策略,对计算用户类型是很好的解决方法,我们来对比分析它和欧式距离。
  上图中,我们反方向延长点A,很明显向量A和B之间夹角余弦值不变,但欧式距离发生改变。也就是说,利用欧式距离更能突出数值绝对差异,因此常用于歌曲间相似度的计算。例如,喜欢A歌曲的用户数量是10000,喜欢B歌曲的用户数是20000,因为样本足够大,我们认为用户对歌曲喜爱的程度相同,也就是相同的分数,那么直接通过数量上的差异来计算相似程度即可。
  由此可见,小到一个数学公式,大到一个数据模型甚至是推荐系统,都没有单纯的对错之分,只有是否适合产品需求,能在有限的计算量内结合情景满足预期。先入为主的方法论是数据策略工作中的大忌。
  常见推荐方法
  推荐和搜索本质有相似的地方。搜索满足用户从海量数据中迅速找到自己感兴趣内容的需求,属于用户主动获取。推荐则是系统从海量数据中根据获取到的用户数据,猜测用户感兴趣的内容并推荐给用户,属于系统推荐给用户。本质上都是为了在这个信息过载的时代,帮助用户找到自己感兴趣的东西。这里我们介绍四种常见的推荐方法。
  基于歌曲的推荐
  基于歌曲的协同过滤
  基于用户的协同过滤
  基于标签的推荐
  (1)基于歌曲的推荐
  基于歌曲的推荐是比较基础的推荐方法,根据我们播放收藏或下载的某类型的歌曲,推荐这种类型下的其他歌曲。这种方式很容易被理解,但是比较依赖内部曲库完善的分类体系,且需要用户有一定的数据积累,不适用于冷启动。
  (2)基于歌曲的协同过滤
  协同过滤与传统的基于内容分析直接进行推荐不同,协同过滤会分析系统已有数据,并结合用户表现的数据,对该指定用户对此信息的喜好程度预测。
  基于歌曲的协同过滤,通过用户对不同歌曲的评分(下载收藏评论分享对应不同分数)来评测歌曲之间的相似性,基于歌曲之间的相似性做出推荐;一个典型的例子是著名的啤酒加尿布,就是通过分析知道啤酒和尿布经常被美国爸爸们一起购买,于是在尿布边上推荐啤酒,增加了啤酒销量。
  计算用户u对歌曲j的喜爱程度:
  N(u)表示与用户有关联的歌曲歌单等集合,wji表示歌曲歌单j和i的相似度,rui表示用户对i的打分。
  推荐时也要综合考虑其他业务数据,比如两首歌曲越多的被加入两个歌单,则认为两首歌越相似。
  (3)基于用户的协同过滤
  基于用户的协同过滤是通过用户对不同歌曲单的行为,来评测用户之间的相似性,基于用户之间的相似性做出推荐。这部分推荐本质上是给相似的用户推荐其他用户喜欢的歌曲,一句话概括就是:和你类似的人还喜欢下列歌曲。
  计算用户u对歌曲i的喜爱程度:
  N(i)表示对歌曲单i有过行为的用户集合,wuv是用户u和用户v之间的相似度,rvi表示用户v对歌曲单i的打分。
  (4)基于标签的推荐
  歌曲有标签,用户也会基于行为被打上标签,系统通过标签将二者关联。
  根据标签进行推荐需要产品在初期就有标签概念,网易云音乐不同的曲目类型是天然的素材标签,通过对UGC内容的处理和对用户行为的数据分析则可以得到用户标签。
  总结
  在广场舞大妈都在谈论AI的时代,基于机器学习的推荐算法实在算不上风口。但是没有任何一种推荐方法或系统能适用全部的情形,在真正实现过程中一定要对算法有熟悉的掌握,另外和一些前辈的交流让我认识到,一个优秀的pm必备的素养之一就是对每一条业务线深刻的理解。
  在构建一个推荐方法时,我们一般会用到加权、降权、屏蔽。一个方法是否能支持灵活调节权重,后期是否能持续迭代,都是要通过不断的测试验证,最终让数据说话。
  根据一些用户反馈和我自身的使用感受,提一些建议:
  网易云音乐推荐算法把用户最近的行为权重置高,因此系统容易大量推荐相似类型的歌曲,使用户审美疲劳、兴奋度降低。建议在算法中加入用户使用场景的分析,并对同类型歌曲出现的次数、位置加以限制;
  针对长尾冷门歌曲,由于数据量相对较少,更要重视效果反馈;深度挖掘数据,丰富推荐元素,比如根据某位用户喜爱歌手的创作成长背景,推荐影响该歌手的音乐、专辑、歌手;
  网易云的情怀令人欢喜,在商业化的今天弥足珍贵。祝越来越好。
  最后,万望不吝赐教。
投诉 评论 转载

学好数理化走遍天下都不怕俗话说学好数理化,走遍天下都不怕。这好比要造高楼必须首先要打好地基一样,数理化就是学任何科学的地基。怎样才能学好数理化呢?首先我们必须热爱科学,要有兴趣,这虽然与老师怎么教有关……网易云音乐分析之推荐算法文章从网易云音乐的推荐功能出发,为我们分享了互联网的常用推荐策略。在上一篇文章中我们对网易云音乐的核心功能音乐推荐进行了简单分析,时隔三个月,从appstore等评分中可……简洁的定义我推导出的定义是:简洁是使用最少的元素有效地满足功能性要求。之所以要下定义基于以下原因:我们经常在讨论简洁,那什么是简洁?如果基本概念不清,那也无法执行。评价简洁的……卧室收纳大技巧还你整洁大卧室房子是许多人心中的一道坎,有许多情侣因为没有房子而分别,又有许多人为了房子背上了半辈子的贷款。当然这些都是题外话,当我们花尽心思终于买了一套房以后,家里的空间该怎么利用这也是让……枇杷树苗如何移栽定植怎样栽种枇杷苗枇杷树苗移栽前需要做哪些准备,枇杷定植坑需要挖多深?枇杷苗定植前需要做什么处理,怎么样定植枇杷苗?枇杷树苗移栽定植时需要注意什么?以下中国三农网就作简单介绍,供网友们参考。……迎夏和迎春花的区别迎夏先叶后花迎春先花后叶迎夏和迎春花,这两种花卉其实挺像的,一个迎接夏天一个迎接春天,而形态和花朵也有近似之处,所以很多人都搞不清楚迎夏和迎春花的区别,这两种花最明显的区别是长叶开花的顺序不同,迎夏是……用好登台阶效应你的用户转化率将成倍增加什么是登台阶效应?聪明的小乞丐在一个风雨交加的夜晚,一个小乞丐到富人家去讨饭。仆人对他的态度非常恶劣,对他大声呵斥:滚开!小乞丐就苦苦哀求道:求求你,让我进去……哈罗单车融资蚂蚁金服等投资领投12月4日消息,据新浪科技报道,哈罗单车已经完成3。5亿美元的D1轮融资,投资方为蚂蚁金服、威马汽车、成为资本、富士达等多家知名投资机构和产业资本。据悉,这是哈罗单车被永……三七三七hr别名:田七、人参三七、参三七、文州三七。性味:甘、微苦,温。归经:归肝、胃经。入药部位:为五加科植物三七Panaxnotoginseng(Burk。)……家居客厅风水最容易被忽视的五大盲点家居风水有的人了解得很多,有的人了解的很少,但是他们都会忽略一些家居风水盲点。那么,家居客厅风水盲点都有哪些呢?盲点一:客厅塞满家具或杂物峦头派风水学有云:高一寸为……工资有多少生育津贴生育津贴很多人都不知道怎么算的,那么,工资4000有多少生育津贴呢?其实,生育津贴是根据你交社保的年份和入职时间长短来计算的,分不清,生育津贴是发6个月还是3个月的朋友们,最好……什么意思网络用语ootd什么意思?相信大家在逛小红书时,总看到有人分享ootd,但并不知道ootd是什么意思,其实大家可以理解为今日穿搭,很多集美们都爱穿搭,不知道什么意思的朋友们可以看看本站……
再长瘦下去我还能活吗日本最奇葩的节日裸体节全身裸体狂奔起源于祭祀神灵浚县隋唐时期国家大粮仓储量够万人吃年一串搞笑的囧语雷语女人长期不来月经是怎么回事不来月经有哪些具体原因美国正在衰退的超级大国男孩子第一次见丈母娘应该做些什么做无痕开眼角手术麻醉方式是什么学校党支部党小组会议记录公司质量检查检测个人工作总结中学下半学年体育组工作总结精选多篇探究品牌定位在市场营销战略中的地位
AppStore欲购清单如何用把App加入欲购清单方法介绍图孩子长跑会影响身高吗“宿敌”难防:职场人如何制胜?为什么有人擅长文科有人却擅长理科各自首次赶超日本!中国成澳洲天然气最大买家热文小型汽车驾驶证取消70岁年龄限制最新时尚短发烫发优雅气质知性十足人教版高中第三册一单元作文良知的叩问激情四射不一样的世界杯英国有转基因食品年上半年财政所会计个人工作总结如何处理好职场人际关系

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找菏泽德阳山西湖州宝鸡上海茂名内江三亚信阳长春北海西安安徽黄石烟台沧州湛江肇庆鹤壁六安韶关成都钦州