沧州三亚菏泽经济预测自然
投稿投诉
自然科学
知识物理
化学生物
地理解释
预测理解
本质社会
人类现象
行为研究
经济政治
心理结构
关系指导
人文遗产
菏泽德阳
山西湖州
宝鸡上海
茂名内江
三亚信阳
长春北海
西安安徽
黄石烟台
沧州湛江
肇庆鹤壁
六安韶关
成都钦州

当朋友圈更新多到看不完时来看看是怎么优化信息流的

9月9日 孤小单投稿
  本文是FREES互联网团队成员覃超与徐万鸿进行的一场AskMeAnything。徐是前Facebook新闻流排序组的资深工程师,在今年9月回国出任神州专车CTO。本文中他们聊的是关于Facebook的GrowthHacking策略、反垃圾信息系统、信息流排序,以及为什么选择回国参与创业。
  所谓新闻流排序(newsfeedranking),指的是Facebook的一项看家本领:用户每天会收到两三千条新鲜事,却只会阅读前50至100条。利用机器学习将用户最想看的内容排到最前面,从而提高粘性和日活。
  这固然是一篇着重技术的文章,所在公司Facebook更是世界上最大的互联网公司之一。但这并不妨碍创业者从中得到经验。利用AB测试作为迭代方法,借助GrowthHacking的核心数据来驱动开发,新员工的入职宣讲这些做法都体现了这位社交之王不同维度的文化所在:精神层面注重实现梦想,统一目标;而这一目标下放到微观层面,就是对于数据的尊重。
  Facebook利用Sigma系统做了什么?
  我第一次去Facebook工作的时候,当时专注于用户增长的VP负责宣讲。他说将来全球所有人都会使用Facebook,这家公司将来会成为万亿美元的公司,这让我印象很深刻。公司的所有人都很兴奋,对设定的目标有非常大的信心。他们的工作使命感非常强,非常专注。
  这是Facebook给我印象深刻的一件事。
  在Facebook的siteintegrity(站点完整性)组工作了两年。当时Facebook有很多的垃圾私信、垃圾信息,就像人人、微博上有各种广告、垃圾链接。有些用户的账号被盗用了,会使用个人页面发送垃圾短信、广告、病毒,还有一些不受欢迎的朋友请求。我会处理所有类似这些涉及到影响用户体验的东西。
  Facebook使用了一个叫做sigma的系统来抵制这些垃圾信息。这个系统安装在2000多台机器上面,Facebook用户做的任何事情,都会经过sigma系统分析处理,比如评论、链接、朋友请求,都会被这个系统进行判断,是正常行为、滥用行为还是有问题的行为。
  利用Sigma系统,Facebook会对垃圾信息进行过滤和清理。
  举个例子说,比如发送朋友请求,Facebook的系统会自动判断一下:如果这个人的朋友请求都被别人拒绝了,他再发送朋友请求是不会被批准的。如果一个人发送的朋友请求十个有九个都被拒绝了,那么他下一次的朋友请求就会被系统拒绝。
  当然这个系统还有其他的判断信号。
  它是一个机器学习系统,通过你之前发的朋友请求拒绝概率高低来判断你被拒绝的概率有多高。
  如果这个比率很高,Facebook会让你进行手机短信或其他方式认证,来验证是软件还是真人发送的,以此判断你是不是真的要发送朋友请求,比如你发出的朋友请求对象与你没有任何共同好友,那就可能是一个不合理的请求。
  基本上,你在Facebook上做的任何事情,都会经过这个系统来分析、预测、决定是否允许你发出信息,借此希望会减少生态圈中的骚扰行为。当时Facebook每天有上百亿次的信息发生要通过这个系统进行判断。
  机器学习是Sigma系统的核心
  Sigma系统中有些是人为规则也有机器算法,请求通过和拒绝就是一个迅捷数据组(Scrum)。任务通过,则说明这个任务是一个对机器学习来说的正样本,被拒绝则是一个负样本,很像0和1。
  比如发送朋友请求如果被接受,y值是1,如果被拒绝就是0。如果是评论和点赞,系统就能寻找y值,用户发送的不当信息就会被删除。
  而机器学习是整个Sigma系统的核心。
  另外一个方法是通过一些异常行为的分析、数据挖掘的方法来分析用户的异常行为。
  比如一个人发的同样类型评论非常多,所有评论里都有一个相似链接,这就非常有问题。正常操作不会在不同人的主页上留同样的评论,这显然属于异常行为,我们不会允许。
  新闻流是Facebook最重要的产品
  我工作两年之后选择去了这个组。
  排序指的是信息流的顺序。它决定了打开你的Facebook朋友圈,你的信息流是个什么样子,信息的位置。每个人产生的内容、新闻会有两三千个,用户只能看到50100个。你需要把两三千个最好地展示出来。有些我们不给用户显示,比如你喜欢游戏,你的朋友不喜欢。
  我2012年刚去的时候,新闻流排序组只有五六个人,尽管这可能是公司最大的机器学习系统,最核心的产品。每天有十亿多人上线,每个用户花40分钟在Facebook上,其中一半时间都花在新闻流上。Facebook大部分收入来自新闻流广告。比如说,移动广告收入占所有广告的70,而其中所有的移动的广告都来自新闻流。不管是从用户的停留时间,还是收入来说,新闻流都是最重要的产品。
  新闻流是Facebook最重要的产品,直接决定了用户所看到的内容。
  做好新闻流排序是很难的问题,因为用户在新闻流上的行为有很多种,不只是传统广告点击或者不点击这一种操作,用户可以在新闻流里赞、评论、分享或者隐藏这个新闻流,也可以播放视频。我需要理解用户喜欢什么东西,评论、分享什么东西,想看什么样的视频。理解用户的兴趣所在,根据我们的讯息把最好的东西放在新闻流的最前面。
  以国内的社交媒体作对比来说,微信的朋友圈是所有内容全部显示,它不需要排序,是因为朋友圈容量不是特别多,大家可以看完所有的内容。朋友越来越多的话,没有时间把分享看完,排序是必然的事情。你会很容易漏掉很重要人的图片,它们迅速埋没在大部分你不感兴趣的内容了。
  Facebook之前也是全部显示,慢慢到后来用户是看不完所有的信息的。如果不做排序,把最好的服务挑出来的话,用户不会愿意访问新闻流,因为他看到很多不感兴趣的东西,感兴趣的部分他已经没有时间找出来了。从不排序到排序是必然的过程,你的朋友越来越多,公众页面越来越多,排序是必然的。
  比如说新浪微博没有做排序,有些细节杂乱无章,他们测试过,但是做得不太好。所以放弃了。微信的朋友圈也会到要做排序的阶段。Facebook不只是排序,还会隐藏用户不感兴趣的内容,比如你的朋友玩过CandyCrush游戏,但可能你本身不玩任何游戏,关于这方面的信息就没有意义。Facebook就不会给你显示这些内容朋友们在玩什么游戏。
  社交媒体的碎片化已成事实。只有采取更好的排序手段,推送给用户更精准的内容,才能提高平台停留时间,加强粘性。
  新闻流排序的工作原理是什么?
  基本上,新闻流是从两三千条内容里面,挑出了四五十个。按照每个内容打分,分高的内容排在最前面。每个内容、照片、分享或者状态,我们会预测一些概率值,比如你点赞的概率,评论、分享的概率。每个用户的行为,比如点赞、分享、评论,系统都会给权值。评这些用户行为概率是通过机器学习来系统计算的。如果用户对某个内容点赞、评论或者分享,说明用户愿意看到这个内容,对内容产生了反馈。
  举个例子来说,比如你是我的好友,你上传了100张照片,我点赞了20次,那么点赞概率就是20。我们知道每个用户以前对哪些内容点赞、评论,这些都是我们的训练样本。我们通过学习用户的历史行为,进行相同类型、相同个人的未来行为预测,因为用户短期行为不会大幅变化,过去对哪些东西进行评论,将来也很有可能对相似内容进行评论。
  对用户内容的预测
  很多人关心,是否可以针对用户内容来进行预测?比如分析用户发了什么样的文字或者图片?这是可以的。如果是图片我们可以抽取图片特点,对图片进行模式识别,分析图片的主题,打上相应的标签,用机器来识别这些图片。现在在做相应的工作。Facebook有AI实验室,可以对图片进行内容识别。
  那么,Facebook该如何检测这套算法的有效性呢?该如何进行更新迭代?
  其实,这可以通过AB测试来实现。我们会抽取1用户进行新的算法,1进行旧的算法。如果新的算法下用户每天点赞、评论或者分享次数增长了,那说明新的算法更好。我们就把新的算法发布给所有的用户。我们主要的核心目标是:让日活跃用户更多,停留时间更长,访问Facebook更频繁。
  AB测试是很好的迭代方法。建立起核心指标,进行AB测试,看新的改动能否提高核心指标,提高就发布,没有提高就不用发布。这很像Growthhacking,当然最终目的还是提高DAU。如果用户喜欢你的新闻流,就会更频繁访问,最终目的还是在线时长和日活跃用户。
  AB测试是Facebook用来测试迭代可行性的手段,目前峰瑞资本所投资的吆喝科技,想让初创企业也能使用到这一技术。
  我已经没法看完所有朋友圈的内容
  我已经没法看完所有朋友圈内容了。一种改进方法是排序,把最好的内容放最前面,通过你以前点赞的内容,来学习你关心的内容,比如你女朋友发的东西你都会点赞。另外一种改进方法叫做内容置顶(Storybumped)。有时候我早上起来刷微信,会看不完,只看了一小部分。过一会儿再刷的时候,已经没有什么新的内容了。
  Facebook的内容置顶功能会把你没有看完的东西再放到上面去再次推送给你。
  微信是知道哪些内容你没看过的,我有很多在美国的朋友,朋友圈会有很多内容,上班前看不完只看了一部分。再刷新的时候就已经没有新的东西出来了,我也没有关心没看完的东西,朋友发的照片。Facebook的内容置顶把很重要的、还没看的、有点旧的内容放在朋友圈前面,让你再看一眼,怕你漏掉重要的内容。
  在九月份的时候我加入神州专车担任CTO,从事业角度来说,我希望把从Facebook学到的公司文化、技术带回中国。中国在计算机行业上有很大的潜力。现在国内的产品质量上和美国产品已经相当了,比如微信,Facebook的产品经理也学习了微信里面的功能。再往后面看几年的话,中国有机会赶上美国。
  计算机学科已经成熟,创造力在慢慢变好。很多初创企业尝试不同的想法,中国的创业者是美国的好多倍,都在尝试不同的想法,会诞生出成功的公司。技术上,中国正在逼近美国,甚至会超越美国。长远来看,中国的计算机行业、互联网行业,应该是有潜力成为世界上互联网行业最好的国家。
投诉 评论 转载

武松和孙二娘是什么关系孙二娘对武松有救命之恩武松绝对是《水浒传》中响当当的英雄之一,他曾在少林习武,景阳冈上打死猛虎,为兄报仇逗杀西门庆,醉打蒋门神,大闹飞云浦,血溅鸳鸯楼,刀劈飞天蜈蚣,后和鲁智深等一起上了梁山。后岁宋……如何看待岁小朋友简历逆天学前教育是越早越好吗今天就跟随小编一起看看如何看待5岁小朋友简历逆天,学前教育是越早越好吗?这里和大家简单介绍一下!10月30日,一则微博消息:输在了起跑线上了!别人家孩子的简历,简历应该是为了就……孕妇可以游泳吗为什么操作方法01:hr需要肯定的是,在孕妇体质条件良好的情况之下,进行适当的活动是能够带来好处的,所以说孕妇是可以通过游泳来进行适量运动的。02:hr孕妇在游泳的时候,……明朝火器真的落后西方吗一组数据带大家揭晓最近很多人在问这个明朝的火器的事情,很多人也都发现了,那就是这个明朝的火器有的人说很强大,有的人说并不强大,而且还落后于西方,那么很多人要问了,这个明朝的火器就真的落后于西方吗……当朋友圈更新多到看不完时来看看是怎么优化信息流的本文是FREES互联网团队成员覃超与徐万鸿进行的一场AskMeAnything。徐是前Facebook新闻流排序组的资深工程师,在今年9月回国出任神州专车CTO。本文中他们聊的……个技巧一步处理偏黄的照片用这4种方法可以很有效的去除照片发黄偏黄的问题首先分析如何去除黄色,看下图颜色混合原理。因为黄色是蓝色的互补色,减黄可以得到纯蓝,那么加蓝不就可以去掉黄色了。又因为黄色是……大白菜后期的种植技巧种植大白菜看起来很简单,其实也是有很多要注意的事项,如果是种植技术不得当,会严重影响大白菜的生长,下面小编为大家介绍大白菜后期的种植技巧,希望能助菜农丰产。莲座期:也是大……草莓水肥管理技术草莓营养价值丰富,被誉为是水果皇后,含有丰富的维生素C、胡萝卜素、叶酸、铁、钙与花青素等营养物质。尤其是所含的维生素C,其含量比苹果、葡萄都高710倍。草莓市场销售量非常高,种……白凤菊的养殖方法白凤菊的简介白凤菊的养殖方法白凤菊的简介白凤菊的简介白凤菊,别名姬鹿角,番杏科、覆盆花属,原产地位于南非及美国部分沿海地区。喜温暖干燥和阳光充足的环境,耐旱,怕水湿,无明显休眠……说话的艺术重权变言利害作者:赵丹阳【导读】捭阖是筹谋定计、言动天下的根本法则,其与道家所论之刚柔、术家所论之去就、儒家所论之显隐、法家所论之赏罚有异曲同工之妙。近人徐焕章在为本篇作……家居月饼盒装饰月饼盒别扔有用途相信很多人都不陌生月饼盒。提到月饼盒,第一反应就是节日,占据重要地位的月饼盒装饰DIY它的选购可不能马虎。现在,市场上的月饼盒装饰DIY众多,价钱价位也不等,如何挑选月饼盒装饰……头枕高山脚踏案后代儿孙富贵全这样的风近日寻龙点穴,遇一地重重环抱,皆为其所生。于是前往现场勘察。到现场发现已经古坟葬于此,墓碑记载为清康熙四十七戊子年葬,乾隆四年己未年立碑。坟自下葬到今,已30……
怎样实现两列互换垃圾焚烧对周围环境和人体有多大危害如何用手机快速制作表情包荔枝放冰箱用什么装妈妈我想对你说校园之声有趣的春游那一次我真的很棒身边的风景也动人妈妈生气了好人就在我身边冲过终点线的那一刻

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找