关系经济人类预测化学自然
投稿投诉
自然科学
知识物理
化学生物
地理解释
预测理解
本质社会
人类现象
行为研究
经济政治
心理结构
关系指导
人文遗产

推荐系统的美好世界

6月2日 托天庙投稿
  我们为什么要关心推荐系统?
  对于大多数人来说,关注推荐系统的关键原因可能是金钱。对于亚马逊,Netflix和Spotify等公司而言,推荐系统可带来巨大的参与度和收入。但这是对事物更加愤世嫉俗的看法。这些公司收入增加的原因是因为它们为客户提供了实际价值推荐系统为具有很多项目的场景中的用户提供了一种可扩展的方式来个性化内容。
  数据科学家特别应该关注推荐系统的另一个原因是,这是一个真正的数据科学问题。也就是说,至少按照我最喜欢的数据科学定义,即软件工程,机器学习和统计之间的交集。我们将看到,构建成功的推荐系统需要所有这些技能,以及更多。
  定义推荐系统
  尝试定义任何内容时,合理的第一步是询问Wikipedia。不幸的是,截至本文发布之日,Wikipedia对推荐系统的定义过于狭窄,即信息过滤系统的子类,旨在预测用户对某项产品的评价或偏好。
  18
  Wikipedia定义的问题在于,推荐系统要比评级预测多得多。首先,推荐者用词不当称其为发现助手更好,因为所谓的推荐远非束缚。其次,系统意味着诸如表示之类的元素很重要,这是使推荐成为如此有趣的数据科学问题的一部分。
  我的定义很简单:
  推荐系统是帮助用户发现他们喜欢的物品的系统。
  推荐范式
  根据要问的人,有两种到二十种不同的推荐范例。通常的分类是根据用于生成建议的数据类型进行的。方法之间的区别是学术性而非实用性的,因为使用混合集成来解决每种方法的局限性通常是一个好主意。尽管如此,值得讨论不同的范例。我的看法是,如果您忽略了通常会出乎意料地有效的琐碎方法(例如,受欢迎的商品,然后再次观看),则有四个主要范例:协同过滤,基于内容的推荐算法和上下文推荐。
  协同过滤可能是最著名的推荐方法,以至于有时它被视为该领域的代名词。主要思想是为用户提供了商品的偏好矩阵,这些矩阵可用于预测缺失的偏好并推荐具有较高预测性的商品。这种方法的主要优点之一是,对于协同过滤已有大量研究,使其易于理解,并且现有的库使实现起来相当简单。另一个重要的优点是协同过滤独立于项目属性。您只需要开始使用用户和项目ID,以及用户对项目的偏好(等级,视图等)的概念即可。
  协同过滤的主要局限性在于它对首选项的依赖。在完全没有首选项的冷启动方案中,它无法生成任何建议。但是,当有数百万个可用的首选项时,也可能发生冷启动,因为纯协作推荐不适用于没有评分的项目或用户,并且在只有几个评分的情况下执行效果通常很差。此外,当偏好矩阵稀疏时,基础协作模型可能会产生令人失望的结果。实际上,这是我在几乎所有部署协同过滤的情况下的经验。它总是需要进行调整,并且永远不会简单地开箱即用。
  基于内容的推荐为用户提供了项的首选项,并根据项内容的特定于域的概念推荐了类似的项。与协同过滤相比,基于内容的推荐的主要优势在于,不需要太多的用户反馈即可开始。甚至一个已知的用户首选项都可以产生许多良好的推荐(这可以导致收集首选项以实现协作推荐)。在许多情况下,基于内容的推荐是最自然的方法。例如,在推荐新闻文章或博客文章时,比较项目的文本内容是很自然的。这种方法也自然地扩展到项目原数据可用的情况(例如,电影明星,图书作者和音乐流派)。
  28
  当项目相似性不太容易定义时,就会出现部署基于内容的建议的一个问题。但是,即使自然而然地衡量相似性,基于内容的建议也可能最终过于统一而无用。这样的建议随着时间的流逝也可能过于静态,从而无法适应单个用户喜好的变化以及基础数据的其他变化。
  上下文推荐算法推荐与用户当前上下文匹配的项目。与忽略上下文(实质上赋予所有用户历史记录相同的权重)的方法相比,这使它们可以更灵活地适应当前用户的需求。因此,与仅基于历史数据的方法相比,上下文算法更可能引起响应。
  上下文推荐者的关键限制与社会和人口推荐者的相似之处上下文数据可能并不总是可用,并且存在使用户无所适从的风险。例如,广告重新定向可以看作是上下文建议的一种形式,它遵循网络上和跨设备的用户,而无需用户明确同意以这种方式进行跟踪。
  关于推荐系统的常识
  准确性神话
  准确性度量的脱机优化足以创建成功的推荐者
  正如Wikipedia对推荐系统的定义所证明的那样,这也许是最普遍的神话。令人惊讶的是它仍然持续存在,因为距McNee等人关于影响力的论文已经有将近十年了,对准确性测量的关注已经对这一领域造成了影响。
  因此,有必要问这个神话来自何方。我的理论是,这是学术界和行业之间的反馈回路。在学术界,发布对脱机数据集上的任意精度度量进行无穷改进的论文非常容易,而在实时系统上进行
  38
  实验则相对困难。但是,业界对离线预测准确性的高度关注是其中一项举措,该举措来自于行业,以100万美元的Netflix奖的形式,其目的是将Netflix评级预测算法的准确性提高10。
  值得注意的是,三年竞赛中产生的大多数算法从未集成到Netflix中。正如Netflix博客上所讨论的:
  您可能想知道两年后赢得100万美元奖金的最终特等奖合奏团发生了什么我们离线评估了一些新方法,但是我们测得的额外精度增益似乎不足以证明将其投入使用所需的工程努力生产环境。
  我们的业务目标是最大程度地提高会员满意度和按月保留订阅人数现在很明显,Netflix奖目标(准确预测电影的收视率)只是有效优化会员的有效推荐系统的众多组成部分之一享受。
  下表说明了一切(摘自上面引用的博客文章的第二部分):
  出现的一个重要问题是:如果用户真的不关心预测准确性,那么他们关心什么?答案是预测准确性具有一定重要性(如上图所示),但这并不是唯一的事情。我认为,关键的考虑因素是UIUX。您可以获得世界上最准确的建议,但是如果没有通过友好的界面及时提供建议,那么没人会知道(或关心)这些建议。
  当然,即使拥有出色的用户界面和准确的预测,在设计推荐系统时也需要注意其他问题。示例包括多样性(显示各种类型的项目),偶然性新颖性(显示用户尚未了解的非显而易见的建议)和覆盖范围(能够为所有用户和项目生成建议)。GuyShani和AselaGunawardana的出色调查涵盖了许多其他考虑因素。
  48
  还要注意的是,通用精度度量存在一个固有的问题。具体而言,当使用均方根误差之类的度量时,可以通过减少低评级的误差来使评级预测算法更好地执行。这是毫无意义的,因为在任何情况下都不会向用户显示低评分的项目。
  最后,脱机评估出现的一个关键问题是,脱机数据集中存在一些偏差,这些偏差不一定会延续到联机方案中。例如,在许多情况下,有一个隐含的假设,即数据确实不是随机丢失的,例如,用户花费大量精力观看和评价电影的事实已经告诉我们很多关于他们的偏见对于这部电影(获得Netflix奖的团队利用这种偏见来发挥自己的优势)。隐藏此收视率并尝试对其进行预测与预测从整组电影中随机挑选的电影的收视率不同。
  黑匣子神话
  您可以构建成功的推荐系统,而不必担心所推荐的内容和建议的提供方式
  一个好的推荐系统必须考虑用户如何与推荐进行交互。例如,显示的建议数量应告知优化过程(例如,您的目标是Precision1还是precision10?)。这些建议的布局方式(例如,水平垂直)往往会影响用户交互。此外,能够解释提出建议的原因也可以轻易获胜。最后,在许多情况下,可用于生成建议的时间量受到限制。
  除了UIUX,好的推荐器系统的设计还必须考虑所推荐的内容。例如,音乐曲目和短视频可以播放多次,因此推荐用户已经看过的项目可能是个好主意。另一方面,诸如洗衣机和汽车之类的物品却很少被消耗。如果用户刚购买了一台洗衣机,他们不太可能很快就想要另一台洗衣机(但他们可能想要烘干机或晾衣绳)。
  〔
  Hynt是电子商务的推荐系统即服务,我一直负责到去年年中。一般的想法是,商家只需在他们的商店页面上添加几行JavaScript,Hynt就在考虑用户和页面上下文的情况下完成了从商店推荐相关商品的艰苦工作。Hynt上线再次确认了许多著名的UIUX课程。最为显着地:
  高于折痕比低于折痕。在不滚动的情况下可见的Hynt小部件的参与度高于页面上较低的参与度。
  58
投诉 评论 转载

女性夏季养生这样做整个夏天不生病夏季气温高,天气热,人们的情绪容易暴躁,特别是女性。这个时候最重要的是修身养性,做好身体各方面的调理工作,才能愉快的度过炎炎夏日。下面就给大家介绍女性夏季养生十要求,让你度过健……推荐系统的美好世界我们为什么要关心推荐系统?对于大多数人来说,关注推荐系统的关键原因可能是金钱。对于亚马逊,Netflix和Spotify等公司而言,推荐系统可带来巨大的参与度和收入。但这……泡脚放上这3样,聪明的耳鸣患者都在这样做泡脚泡的好,可以帮助我们达到养生保健的效果,如果在泡脚的同时,放上这3种东西,可以帮助我们改善耳鸣。1、花椒泡水,花椒具有温中散热,健脾除湿的功效,花椒泡水可以温经通络散……隔夜水不一定致癌真正少喝的是这种水别搞错了水是生命之源,但是生活中虽然说离不开水,有些人却也常说水是疾病的根源。相信大家都有在网上听说过隔夜水和千滚水不能喝。因为容易伤害到身体。真的是这样吗?隔夜水和千滚水致癌?下面本……厚厚造句用厚厚造句大全271)这些有着黄色条纹与厚厚粉红色嘴唇的美丽鱼类,在这样的交配聚会中回游。272)湖北日报讯记者饶扬灿通讯员郭军6日一大早,竹溪县蒋家堰镇中原村肖高升家的葡萄园内,厚厚……好文明!小米vivoOPPO达成一键换机合作苹果表带识别专利3月22日,是国产安卓生态的大日子小米、vivo、OPPO达成合作,三家厂商的一键换机新增三方应用数据迁移功能。也就是说,以后小米vivoOPPO三家厂商的用户(包括真我……做清蒸鱼时万万不要再用蒸鱼豉油了换成中国人的餐桌向来都是比较讲究的,无论因为什么事儿聚在一起,都要讨一个好彩头,所以【鱼】是最不能缺少的!不过话又说回来,【鱼】也是大家最不愿尝试的食材,做法繁琐,而且腥味重,一不……震惊世界十大考古新发现詹姆斯顿神秘石碑考古界一直在不断的发现新的历史遗迹,挖掘出更多的探索价值,很多考古发现具有很高的历史价值,下面盘点下考古十大发现。1、最大盎格鲁撒克逊宝藏考古爱好者特里赫伯特在英国……深夜致自己短句深夜语录1、挤不进去别人的世界,就好好呆在自己的世界,活好自己的人生即可,晚安!2、行动是治愈焦虑的良方,所以该行动时,就不要犹豫,晚安!3、当你期待的美好没有发生时,请不……宝宝肺热咳嗽的食疗偏方宝宝肺热咳嗽,临床表现为咳嗽、咳黄痰或白粘痰,早晚咳嗽较为严重,伴有口干、咽痛、大便干、舌红、身热或伴有喘息等症状;有的宝宝还会出现舌体或舌尖溃疡,眼屎,口臭,甚至会出现地图舌……这种爱,温暖了全世界人的朋友圈,唤醒了十几亿人的灵魂生命都是有残缺的这世上没有完美和圆满坦然接受自己的不完美也坦然面对生活的不圆满就是对自己最大的眷顾与爱爱自己,才会赢得别人的爱爱别人,才是真……街头求助饭钱的行骗对象有哪些社会千奇百怪,诈骗事件也层出不穷,特别是街头吃饭求助骗局,当代社会大街小巷常见的就是求助饭钱的骗局以及街头通过求助吃饭进行诈骗,那么街头求助饭钱的行骗对象有哪些呢?今天小编就来……
14位撞名的女明星,同名不可怕,谁不红谁尴尬夜间造句用夜间造句大全越战越勇!徐杰社媒发文,00后小将蜕变世预赛尽情绽放牛肉灌汤蒸饺这样做更好吃我们这十年坐标中国深空测控系统捕捉太空的声音每天飞行数百公里,这种害虫有个另类窍门对手告诉你击败雅思组合有多难!头皮上出现的小颗粒,到底是什么东西?到底能不能用手抠?我最爱看的书第十七届小五羊杯青少年象棋大赛开赛微信要借助智能硬件通向下一个风口正待造句用正待造句大全
年老监理总结条装修防坑指南水电木瓦女子在私立医院做护士3年,晒出工资和奖金,还以为看错了你们是从什么时候放弃看《天天向上》的?热博聚热点网 家用智能净水机排行榜(第一名好评率99)太完美的爱情(最完美的爱情,莫过于这4点)古代的状元放在现代社会是什么学历养成好习惯,有效预防肾炎的发生益母草绿茶做法及功效介绍42岁萧亚轩又分手,被狗咬伤脸头部缝针,这三年她过得有点惨争议!中超天王山之战来袭,三镇球迷爆粗,围堵敲打泰山大巴店铺定位淘宝店铺定位淘宝店铺定位案例分析一个人走路的姿势,暴露了他的人品,看准不准?

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找菏泽德阳山西湖州宝鸡上海茂名内江三亚信阳长春北海西安安徽黄石烟台沧州湛江肇庆鹤壁六安韶关成都钦州