沧州三亚菏泽经济预测自然
投稿投诉
自然科学
知识物理
化学生物
地理解释
预测理解
本质社会
人类现象
行为研究
经济政治
心理结构
关系指导
人文遗产
菏泽德阳
山西湖州
宝鸡上海
茂名内江
三亚信阳
长春北海
西安安徽
黄石烟台
沧州湛江
肇庆鹤壁
六安韶关
成都钦州

机器学习助推精准销售预测

10月22日 九阙忬投稿
  如今DT(Datatechnology)时代,数据变得越来越重要,其核心应用预测也成为互联网行业以及产业变革的重要力量。对于零售行业来说,预测几乎是商业智能(BI)研究的终极问题,单纯从机器学习的角度来说,做到精准预测很容易,但是结合业务提高企业利润却很难。预测精确性是核心痛点。
  业务挑战
  针对服装这类的时尚产业的客户需求,tecdat(a)参考ZARA,将产品粗略分为:基本款和时装。对于基本款,每年都没什么大变化,国际流行的影响也不大,那么可以进行长计划生产。对于时装,决定潮流走向的决策权不在某个区域,一个地方的买手们也没有成长到可以准确预判国际流行趋势,所以需要结合不同区域的各种因素,进行预测。对应的,在新货构成中,销量预测策略为:基本款计划生产,时尚款机动调整。
  解决方案
  任务目标
  根据服装零售业务营销要求,运用多种数据源分析实现精准销量预测。
  数据源准备
  沙子进来沙子出,金子进来金子出。无数据或数据质量低,会影响模型预测效果。在建立的一个合理的模型之前,对数据要进行收集,搜集除已有销量数据之外的额外信息(比如天气、地点、节假日信息等),再在搜集的数据基础上进行预处理。
  有了数据,但是有一部分特征是算法不能直接处理的,还有一部分数据是算法不能直接利用的。
  特征转换
  把不能处理的特征做一些转换,处理成算法容易处理的干净特征。举例如下:
  销售日期。就时间属性本身来说,对模型来说不具有任何意义,需要把日期转变成到年份、月份、日、周伪变量。
  产品特征。从产品信息表里面可以得到款式、颜色、质地以及这款产品是否是限量版等。然而并没有这些变量。这就需要我们从产品名字抽取这款产品的上述特征。
  以上例举的只是部分特征。
  构造
  以上说明了如何抽取相关特征,我们大致有如下训练样本(只列举部分特征)。
  划分训练集和测试集
  考虑到最终模型会预测将来的某时间段的销量,为了更真实的测试模型效果,以时间来切分训练集和测试集。具体做法如下:假设我们有2014020120170617的销量相关数据。以2014020120160319的销量数据作为训练,2016032020170617的数据作为测试。
  建模
  ARIMA
  ARIMA模型是指将非平稳时间序列转化为平稳时间序列,然后将结果变量做自回归(AR)和自平移(MA),一般应用在股票和电商销量领域。
  随机森林
  用随机的方式建立一个森林,森林由很多决策树组成,随机森林的每一棵决策树之间是没有关联的。在得到森林之后,当有一个新的输入样本进入的时候,就让森林中的每一棵决策树分别进行一下判断,看看这个样本应该属于哪一类(对于分类算法),然后看看哪一类被选择最多,就预测这个样本为那一类。
  支持向量回归(SVR)
  SVR最本质与SVM类似,都有一个margin,只不过SVM的margin是把两种类型分开,而SVR的margin是指里面的数据会不会对回归有帮助。
  模型优化
  1。上线之前的优化:特征提取,样本抽样,参数调参。
  2。上线之后的迭代,根据实际的ABtesting和业务人员的建议改进模型
  从上图可以看出,在此案例中,svm和随机森林算法模型的预测误差最小,运用3种方法预测某商品的销量,其可视化图形如下:
  可以看出,销量的预测值的趋势已经基本与真实销量趋势保持一致,但是在预测期较长的区间段,其预测值之间的差别较大。
  评估效果不能只看销量,要综合考虑,需要参考业务对接、预测精度、模型可解释性和产业链整体能力等因素综合考虑;不能简单作为企业利润增加的唯一标准。我们的经验是,预测结果仅作为参考一个权重值,还需要专家意见,按照一定的权重来计算。
  展望
  除了以上列举的一些方法,tecdat(a)已经在尝试更复杂的销售预测模型,如HMM、深度学习(LongShortTermMemory网络、卷积神经网络(CNN))等;同时需要考虑到模型的可解释性、可落地性和可扩展性、避免黑箱预测;还在尝试采用混合的机器学习模型,比如GLMSVR,ARIMANNET等。
  销售预测几乎是商业智能研究的终极问题,即便通过机器学习算法模型能够提高测试集的预测精度,但是对于未来数据集的预测,想做到精准预测以使企业利润最大化,还需要考虑机器学习模型之外的企业本身因素。比如,企业的整体供应链能力等,如何将企业因素加入到机器学习模型之中,是未来预销售预测的一个难点与方向。因此,要想解决销售预测终极问题还有一段路要走。
  版权声明:为拓端数据原创文章,未经允许不得转载!
投诉 评论 转载

苹果胡萝卜汁的做法(回味无穷的胡萝卜苹果汁)苹果胡萝卜汁的做法(回味无穷的胡萝卜苹果汁)最近把破壁机拿出来用了,想着可不能让它继续闲置了,所以一定要好好用起来!这款苹果汁做法简单,而且能够美容养颜,还能瘦身,真的很……皮肤为什么衰老的原因(皮肤衰老是怎么造成的)皮肤的衰老是一种正常的生理现象,从我们出生开始,皮肤老化的现象就一直存在。其产生的原因是多方面的,有生理上的,也有外部环境等多种因素的影响。造成皮肤衰老的主要生理原因是这……分米等于多少平方米(一分半是多少平方米)小学数学考试总常出的单位进率问题,不用担心记不清,今天咱们来系统的进行一下复习。小学数学量的计算单位及进率总结1、长度计量单位及进率:千米(公里)、米、分米、……小学生适合背什么书包每个学生都有自己的书包,用于装课本、作业本等学习用品。如果将这些学习用品统一放进书包的话,书包是有一定的重量的,所以给孩子选择一款好的书包相当重要,好的书包不仅质量好,而且背上……核电站的工作原理(中国核废水怎么处理)核电站的工作原理(中国核废水怎么处理)中国启明星二号取得新进展,又一次实现了对国外的技术封锁、让其他国家羡慕不已、站在了世界最高处!那么启明星二号到底是什么?启明星……机器学习助推精准销售预测如今DT(Datatechnology)时代,数据变得越来越重要,其核心应用预测也成为互联网行业以及产业变革的重要力量。对于零售行业来说,预测几乎是商业智能(BI)研究的终极问……竞选学委演讲稿精选多篇第一篇:竞选学生分会主席演讲稿尊敬的老师、亲爱的同学们:大家好我是09级45班的付云升,首先要感谢老师给我这样的一个机会参加第四届学生分会的竞选,今天我要竞选的是主……我的中学生活自信飞扬睁开朦胧的双眼,卷帘推窗。一束晨光洒下,洒向大地,洒向了万千生灵完全胜利他一颗正在蓬勃的生命是人的升级指数你无法想象大需求他还是一只肉肉不敢示人的小鸟,转眼望去桥那一束晨光是他……女性外阴发育不良的七大特征外阴发育不良1。阴蒂发育不良:阴蒂发育不良较罕见,患者几乎从不为此就医,妇科检查时医生也很少注意这一缺陷。患者可有性欲减退或性高潮丧失。2。阴蒂肥大:阴蒂肥大易引起……info是什么意思(汽车info是什么意思)日常生活中,我们难免会接触到一些新车或者陌生的车,比如刚刚买了新车或临时使用朋友的车,这时候驾驶舱环境对自己来说多少会有些陌生,自己熟悉的功能及按键一时找不到,导致很多实用性功……用力造句用用力造句大全91。生死之间这么脆弱,就像一个玻璃瓶子一般,一掉地就碎了,可是就有人用力的把瓶子往地上砸。92。人生就是如此,你以为已经从一个漩涡逃离,其实另外一个漩涡就在你的脚下。用……tears是什么意思(齐豫tears词曲作者)首先感谢大家在百忙之中来捧场文文谈钢琴,我也是伴奏学习者新手一枚,其实我的钢琴1000天,也是我现学现弹的一些感受,本人也是小白一枚,喜欢边学习变分享。我们大家一起努力、……
改革工程测量教学的策略研究圆圆的帽子种头发去哪里(谁知道哪里种植头发好)下水道和孩子望江南也说文学奖王立华大校(浦安修)气滤多少钱(空气滤芯不密封后果)动漫网站有哪些(为什么有些动漫网站)哪种瓷砖更容易产生辐射我的清华梦半夜点最忌讳做这件事托班冬季育儿知识(冬季育儿小常识)

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找