关系经济人类预测化学自然
自然科学
知识物理
化学生物
地理解释
预测理解
本质社会
人类现象
行为研究
经济政治
心理结构
关系指导
人文遗产

通俗易懂05梯度提升决策树GBDT

2月26日 先锋客投稿
  视频详解:通俗易懂三哥讲机器学习05机器学习梯度提升决策树GBDT1。GBDT算法
  GBDT(GradientBoostingDecisionTree),全名叫梯度提升决策树,是一种迭代的决策树算法,又叫MART(MultipleAdditiveRegressionTree),它通过构造一组弱的学习器(树),并把多颗决策树的结果累加起来作为最终的预测输出。该算法将决策树与集成思想进行了有效的结合。
  GBDT中的树是回归树(不是分类树),GBDT用来做回归预测,调整后也可以用于分类。
  1。1应用场景1、用于自动挖掘有效特征、特征组合2、作为LR模型中的特征,提高CTR预估3、GBDT应用于淘宝的搜索及预测业务1。2Boosting核心思想
  Boosting方法训练基分类器时采用串行的方式,各个基分类器之间有依赖。它的基本思路是将基分类器层层叠加,每一层在训练的时候,对前一层基分类器分错的样本,给予更高的权重。测试时,根据各层分类器的结果的加权得到最终结果。
  Bagging与Boosting的串行训练方式不同,Bagging方法在训练过程中,各基分类器之间无强依赖,可以进行并行训练。
  2、GBDT详解GBDT的原理所有弱分类器的结果相加等于预测值。每次都以当前预测为基准,下一个弱分类器去拟合误差函数对预测值的残差(预测值与真实值之间的误差)。GBDT的弱分类器使用的是树模型(cart)。
  如图是一个非常简单的帮助理解的示例,我们用GBDT去预测年龄:第一个弱分类器(第一棵树)预测一个年龄(如20岁),计算发现误差有10岁;第二棵树预测拟合残差,预测值6,计算发现差距还有4岁;第三棵树继续预测拟合残差,预测值3,发现差距只有1岁了;第四课树用1岁拟合剩下的残差,完成。
  最终,四棵树的结论加起来,得到30岁这个标注答案(实际工程实现里,GBDT是计算负梯度,用负梯度近似残差)GBDT计算流程
  1、GBDT与负梯度近似残差
  回归任务下,GBDT在每一轮的迭代时对每个样本都会有一个预测值,此时的损失函数为均方差损失函数:
  损失函数的负梯度计算如下:
  可以看出,当损失函数选用均方误差损失时,每一次拟合的值就是(真实值预测值),即残差。2、GBDT训练过程
  我们来借助1个简单的例子理解一下GBDT的训练过程。假定训练集只有4个人(A、B、C、D),他们的年龄分别是(14,16,24,26)。其中,A、B分别是高一和高三学生;C、D分别是应届毕业生和工作两年的员工。
  我们先看看用回归树来训练,得到的结果如下图所示:
  接下来改用GBDT来训练。由于样本数据少,我们限定叶子节点最多为2(即每棵树都只有一个分枝),并且限定树的棵树为2。最终训练得到的结果如下图所示:
  上图中的树很好理解:A、B年龄较为相近,C、D年龄较为相近,被分为左右两支,每支用平均年龄作为预测值。我们计算残差(即实际值预测值),所以A的残差14151。这里A的预测值是指前面所有树预测结果累加的和,在当前情形下前序只有一棵树,所以直接是15,其他多树的复杂场景下需要累加计算作为A的预测值。
  上图中的树就是残差学习的过程了:把A、B、C、D的值换作残差1、1、1、1,再构建一棵树学习,这棵树只有两个值1和1,直接分成两个节点:A、C在左边,B、D在右边。这棵树学习残差,在我们当前这个简单的场景下,已经能保证预测值和实际值(上一轮残差)相等了。我们把这棵树的预测值累加到第一棵树上的预测结果上,就能得到真实年龄,这个简单例子中每个人都完美匹配,得到了真实的预测值。
  最终的预测过程是这样的:A:高一学生,购物较少,经常问学长问题,真实年龄14岁,预测年龄A15114B:高三学生,购物较少,经常被学弟提问,真实年龄16岁,预测年龄B15116C:应届毕业生,购物较多,经常问学长问题,真实年龄24岁,预测年龄C25124D:工作两年员工,购物较多,经常被学弟提问,真实年龄26岁,预测年龄D25126
  综上,GBDT需要将多棵树的得分累加得到最终的预测得分,且每轮迭代,都是在现有树的基础上,增加一棵新的树去拟合前面树的预测值与真实值之间的残差。3。梯度提升vs梯度下降
  下面我们来对比一下梯度提升与梯度下降。这两种迭代优化算法,都是在每1轮迭代中,利用损失函数负梯度方向的信息,更新当前模型,只不过:梯度下降中,模型是以参数化形式表示,从而模型的更新等价于参数的更新。
  梯度提升中,模型并不需要进行参数化表示,而是直接定义在函数空间中,从而大大扩展了可以使用的模型种类。
  3。GBDT优缺点1)优点预测阶段,因为每棵树的结构都已确定,计算速度快。适用稠密数据,泛化能力和表达能力都不错,数据科学竞赛榜首常见模型。可解释性不错,鲁棒性亦可,能够自动发现特征间的高阶关系。2)缺点GBDT在高维稀疏的数据集上,效率较差,且效果表现不如SVM或神经网络。适合数值型特征,在NLP或文本特征上表现弱。训练过程无法并行,工程加速只能体现在单颗树构建过程中。4。随机森林vsGBDT1)相同点都是集成模型,由多棵树组构成,最终的结果都是由多棵树一起决定。RF和GBDT在使用CART树时,可以是分类树或者回归树。2)不同点训练过程中,随机森林的树可以并行生成,而GBDT只能串行生成。随机森林的结果是多数表决表决的,而GBDT则是多棵树累加之。随机森林对异常值不敏感,而GBDT对异常值比较敏感。随机森林降低模型的方差,而GBDT是降低模型的偏差。代码演示GBDT数据集随机生成sklearn可视化决策树插件Download:https:graphviz。orgdownload决策树插件安装文档:https:blog。csdn。netu012744245articledetails103360769
投诉 评论 转载

如何除去三七农药残留农药残留是农药使用后一个时期内没有被分解而残留于生物体收获物、土壤、水体、大气中的微量农药原体、有毒代谢物、降解物和杂质的总称那三七中有农药残留吗?三七,中药名。主产于云南文山……利用本地优势承揽活动经销商巧赚厂家的钱作为经销商,自然是赚下游客户的钱。不过,你想过赚上游厂家的钱吗?以往,经销商靠差价赚取利润,但现在,上面的厂家大搞通路扁平化,下面超级零售终端又在迅速崛起,而……芦苇中的鱼捧一轮明月,洒一地的雪花。雪花,你是否看见了它莹亮的身影,是否也看见了它莹莹剔透,雪花美丽如云后的景致?如果可以,我愿在每一个飘雪的日子里,与你同赏一枚沁凉的心事,共享一年年中……有人在醉酒打伤别人店家需要负责吗随着生活水平的提高,人们的生存压力也逐渐加大,人们为了放松心情,减小压力,通常都会到ktv去消遣,那么有人在KTV醉酒打伤别人店家需要负责吗?下面由本站帮你介绍一下。1、……目前发现的离地球最远的恒星位于地球亿光年外导语:宇宙的秘密一直都是十分吸引人,值得探索和发现的,之前大家了解过了离太阳最近的十大恒星,那么大家有没有思考过离地球最远的恒星呢?探秘志小编带大家一起了解吧。目前发现的……女人最饥不择食的个阶段男人一定要把握住1、单身的时间太久经历过爱情的女人,一旦恢复了单身的生活,难免心里会有些寂寞。时间长了,就会想结束掉单身的状态。这个时候,如果有一个人对她说我喜欢你,不管对方是什么类型的……一人之城矗立于漠北之上的水泥森林,从被戏谑鬼城之说,到北方迪拜的誉冠。一个如纨绔煤二代般的城市,正在用行动诋毁着谣言。陌上的偏隅,并未跨频意识的求同存异,坚守到最后一批甚至最后一……23岁内马尔队友再当爹!35岁演员妻子生二胎,2个娃生日有意在世界足坛,巴黎圣日耳曼队是一支土豪球队,这支队伍现在拥有多名世界顶级的巨星,比如,大家喜欢的内马尔、梅西都在这支队伍效力。内马尔和梅西都是世界足坛响当当的人物,他们两个人也会……世界杯四强名单出炉,半决赛即将开始!阿根廷和克罗地亚赛前分析昨天法国和英格兰的重心依然没有问题,果然法国2比1拿下英格兰。姆巴佩状态在线!这场比赛也是被我稳稳命中比分!预测成功我们先来看看这届世界杯的四强名单!赛前的夺冠大热……通俗易懂05梯度提升决策树GBDT视频详解:通俗易懂三哥讲机器学习05机器学习梯度提升决策树GBDT1。GBDT算法GBDT(GradientBoostingDecisionTree),全名叫梯度提升决策……雅克萨之战真相是什么为何有人会否定雅克萨之战最近很多人在说这个雅克萨之战的事情,很多人也都在说这场战役的真相到底是什么却不知道,其实也还是比较好理解的,还有很多人也都说了,很多人都在否定这个雅克萨之战,那么这句话到底要怎……走马上任!足协宣布孙雯最新任命,挂帅青训营团长,陈戍源后悔吗大年刚过,神州大地已经迎来了万物复苏的迹象,各业各行也都是在蓄势待发之中迎接挑战,期待扭转疫情时代的颓势,希望打赢一场翻身仗。但此时此刻的中国足球呈现给我们的是什么?似乎依然处……
结构体数据对齐方法的研究怎么回事?惠州年轻人都喜欢去这里英媒中国5左右目标传递两大信号什么是婴儿伞车谈互联网金融对宏观经济的影响中医治疗慢性泄泻(脾虚湿盛型)古方1则香砂二术止泻汤过年在家试试自制泡椒凤爪美媒爆料冲突原因魔术球员嘲讽詹姆斯没有一枚真正的戒指!拼凑造句用拼凑造句大全美丽的杭州西湖公孙胜是个什么样的人公孙胜性格特点解析辣王李永志每天吃5斤辣椒配白酒,破世界纪录,结果如何?
浙江毕业一年后的大学生择业情况调查报告适合中学生观看的15部励志电影家长应学会怎样急救小儿休克预防万一打击教育作假需从打击假检查开始男子吐槽华为女博士辞职去当海军,要留华为早财富自由了舞龙沧海桑田火星海洋为何销声匿迹?生态变化很重要情感美文如何使妆容更服帖这几招帮你打造完美持久妆效一个人走衰运时最忌讳做的和最该做的事建议收藏全新宝马3系新旧对比在售款最高10万元优惠究竟等新还是买旧?国产科技终于发力,实现技术大升级,维护我国科技霸权

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找菏泽德阳山西湖州宝鸡上海茂名内江三亚信阳长春北海西安安徽黄石烟台沧州湛江肇庆鹤壁六安韶关成都钦州