关系经济人类预测化学自然
中准网
自然科学
知识物理
化学生物
地理解释
预测理解
本质社会
人类现象
行为研究
经济政治
心理结构
关系指导
人文遗产

埋点到底要不要源自数据采集的痛苦幻想与失望

9月5日 多上心投稿
  随着移动互联网时代的兴起和数据量的大规模爆发,越来越多的互联网企业开始重视数据的质量。在我创业的这一年里,接触了200多家创业型公司,发现如今的企业对数据的需求已经不仅仅局限于简单的PV、UV,而是更加重视用户使用行为数据的相关分析。
  做数据的同学都知道,在数据分析的道路上,数据采集是重中之重。数据采集的质量直接决定了你的分析是否准确。而随着企业对数据的要求越来越高,埋点技术也被推到了风口浪尖。所谓,埋的好是高手,埋不好反倒伤了自己。而在数据采集的道路上大家经常会遇到各种各样的问题,今天我们就来分析一下埋点是否需要。
  首先我把数据采集的问题归结为三类:
  不知道怎么采,包括采集什么数据以及用什么技术手段采集;
  埋点混乱,出现埋错、漏埋这样的问题;
  数据团队和业务工程团队配合困难,往往产品升级的优先级大于数据采集的优先级。
  上面这三类问题让数据团队相当痛苦,进而幻想弃用数据采集,而尝试新方案后,进而迎来的是更大的失望。这里我对这三类问题的现状及应对之策做一下分析。
  不知道怎么采集数据
  一般创业公司的数据采集,分为三种方式:
  第一种直接使用友盟、百度统计这样的第三方统计工具
  通过嵌入AppSDK或JSSDK,来直接查看统计数据。这种方式的好处是简单、免费,因此使用非常普及。对于看一些网站访问量、活跃用户量这样的宏观数据需求,基本能够满足。
  但是,对于现在一些涉及订单交易类型的产品,仅仅宏观的简单统计数据已经不能满足用户的需求了,他们更加关注一些深度的关键指标分析,例如:用户渠道转化、新增、留存、多维度交叉分析等。这个时候才发现第三方统计工具很难满足对数据的需求,而出现这样的问题并不是因为工具的分析能力薄弱,而是因为这类工具对于数据采集的不完整。通过这种方式SDK只能够采集到一些基本的用户行为数据,比如设备的基本信息,用户执行的基本操作等。但是服务端和数据库中的数据并没有采集,一些提交操作,比如提交订单对应的成本价格、折扣情况等信息也没有采集,这就导致后续的分析成了巧妇难为无米之炊。
  通过客户端SDK采集数据还有一个问题就是经常觉得统计不准,和自己的业务数据库数据对不上,出现丢数据的情况。这是前端数据采集的先天缺陷,因为网络异常,或者统计口径不一致,都会导致数据对不上。
  第二种是直接使用业务数据库做统计分析
  一般的互联网产品,后端都有自己的业务数据库,里面存储了订单、用户注册信息等数据,基于这些数据,一些常用的统计分析都能够搞定。这种方式天然的就能分析业务数据,并且是实时、准确的。
  但不足之处有两点:一是业务数据库在设计之初就是为了满足正常的业务运转,给机器读写访问的。为了提升性能,会进行一些分表等操作。一个正常的业务都要有几十张甚至上百张数据表,这些表之间有复杂的依赖关系。这就导致业务分析人员很难理解表含义。即使硬着头皮花了两三个月时间搞懂了,隔天工程师又告诉你因为性能问题拆表了,你就崩溃了。另一个不足之处是业务数据表的设计是针对高并发低延迟的小操作,而数据分析常常是针对大数据进行批量操作的,这样就导致性能很差。
  第三种是通过Web日志进行统计分析
  这种方式相较于第二种,完成了数据的解耦,使业务数据和统计分析数据相互分离。然而,这种方式的问题是目的不纯。Web日志往往是工程师为了方便Debug顺便搞搞,这样的日志对于业务层面的分析,常常缺斤少两。并且从打印日志到处理日志再到输出结果,整个过程很容易出错,我在百度就花了几年的时间解决这一问题。
  所以,以上三种方式虽然都多多少少解决了一部分数据采集的问题,但又都解决的不彻底。
  无法解决的数据采集问题
  埋点混乱
  聊完采集方法,再来说说关于埋点的管理。我曾经接触了一家做了七八年的老牌互联网公司,他们的数据采集有400多个点。每次数据产品经理提出数据采集的需求后,工程师就会按照要求增加埋点,然后交给数据产品经理去验证。数据产品经理在试用的时候也感觉不到异常,可等产品上线之后,才发现埋的不对,再进行升级发版操作,整个过程效率极低。我们发现,一个公司发展到了一定程度,没有专人去负责埋点管理工作,数据采集就完全没有准确性可据采集就完全没有准确性可言。甚至有时产品上线之后,才发现数据采集的工作没有做,也就是漏埋了。
  于是数据团队又开始幻想,既然埋点这么容易出问题,有没有可能不埋点?这就像寻找可以祈求风调雨顺的神灵。
  在2010年,我的团队曾经做了一个叫ClickMonkey的产品,只要页面上嵌入SDK,就可以采集页面上所有的点击行为,然后就可以绘制出用户点击的热力图,这种方式对于一些探索式的调研还是比较有用的。到了2013年,国外有家数据分析公司HeapAnalytics,把这种方式更近一步,将App的操作尽量多的采集下来,然后通过界面配置的方式对关键行为进行定义,这样便完成了所谓的无埋点数据采集。使用这种方案,必须在产品中嵌入SDK,等于做了一个统一的埋点,所以无埋点的叫法实际上是全埋点的代名词。
  另外,这种方式同样也只能采集前端数据,后端服务器和数据库中的数据,依旧是无可奈何的。并且,即便进行前端数据采集,也无法深入到更细粒度。比如提交订单操作,订单运费、成本价格之类的维度信息,都丢失掉了,只剩下提交这一个行为类型。
  对于非技术人员,容易被这种方式的名称和直接优势所吸引,但很快又会发现许多深度数据分析需求无法直接满足,进而有种被忽悠的感觉,会感到失望。其实不止是非技术人员,即使是技术人员,也都会让我解释一下可视化埋点的原理,说明无埋点真是个有迷惑性又不甚清晰的概念,难以细究。
  这里说一下关键点:一是事先在产品上埋一个SDK,二是通过可视化的方式,生成配置信息,也就是事件名称之类的定义,三是将采集的数据按照配置重命名,进而就能做分析了。
  数据团队和业务工程团队的配合问题
  最后,我们再聊一聊数据采集中遇到的非技术性问题。一般来说,公司到了A轮以后,都会有专门的数据团队或者兼职数据人员,对公司的一些业务指标负责。即使为了拿到这些基本的业务指标,一般也要工程团队去配合做一些数据采集工作。这个时候雷军的快理念就起到作用了,天下武功唯快不破。于是所有事情都要给产品迭代升级让路,快的都没有时间做数据采集了。殊不知没有数据指标的支撑,又怎么衡量这个功能升级是不是合理的呢?互联网产品并不是功能越多就越好,产品是否经得起用户考验,还是要基于数据说话的,然后学习新知识,用于下一轮的迭代。
  数据团队和业务工程团队是平级的团队,而数据团队看起来总是给业务工程团队增加麻烦事儿,似乎也不能直接提升工程团队的KPI,所以就导致需求不被重视,总是被更高优先级的事情挤掉,数据的事情难有进展。
  解决之道
  前面给大家抛出了数据采集中常见的三类问题,下面我们来看一下应对之道。
  首先从意识上要重视数据采集工作
  对于不知道数据怎么采的问题,首先从意识上要重视数据采集工作。数据的事情归结起来就两点:数据采集和数据分析。可不能只看到数据分析而忽略了数据采集。事实上我个人在百度做数据的几年里,最大的心得就是数据这个事情要做好,最重要的是数据源,数据源收集得好,就成功了一大半。数据采集的基本原则是全和细。全就是把多种数据源都进行采集,而不只是客户端的用户数据。细就是强调多维度,把事件发生的一系列维度信息,比如订单运费、成本价格等,尽量多的记录下来,方便后续交叉分析。
  需要数据架构师
  其次,要有一个数据架构师,对数据采集工作负责,每次数据采集点的增加或变更,都要经过系统化的审核管理,不能顺便搞搞。最后,我这里要推荐Event数据模型,针对用户行为数据,简化成一张宽表,将用户的操作归结为一系列的事件。
  对于埋点混乱的问题,前面提到的数据架构师的角色,要对这块的管理负责。如果前面完成对Event的梳理,这里的埋点就会清晰很多。另外还要推荐尽量从后端进行埋点,这样便无需多客户端埋点了。当然,如果有行为只在客户端发生,还是要在客户端进行埋点的。对于业务复杂的情况,只有负责人还不够。目前我们神策分析针对这个问题,推出了埋点管理功能,对于每个采集点的数据收集情况,都能够做到全盘监控,并且可以针对一些无效采集点进行禁用。总之是希望把这个问题尽量好的解决掉。
  对于数据团队和工程团队的配合问题,我这里是想说给创业公司的创始人听的。两个平行部门间的推动,是很难的。数据的事情一定要自上而下的推动,也就是创始人一定要重视数据,把数据需求的优先级提升,这样在项目排期时,能够把数据的需求同时做了。我们知道两军对战,情报收集工作的重要性。做产品也是一样,数据收集工作的重要性不言而喻。
  最后,期望越来越多的创始人,从拍脑袋决策逐步向数据驱动决策做出转变。
  最后,告诉大家一个好消息:
  为了帮助在运营进阶路上,执着前进的伙伴们能够更快速的提升,我们联合了腾讯、百度等拥有10年以上经验沉淀的实战派导师,推出了【运营总监修炼之道】,至今已帮助5000多名运营管理者和进阶者,掌握了更加系统全面的运营专业知识和管理思路,在处理类似运营战略规划、不同渠道运营策略和流量变现、品牌营销玩法、数据分析等实际问题时有更清晰的解决方向!
  扫描二维码添加小助手了解详情,还可以回复笔记领取【运营总监课程学习笔记】哦!
  再犹豫,机会就没啦
投诉 评论 转载

被曹操抓走后神秘失踪的刘备夫人和儿子是谁在三国里都说不要当曹操的手下,不要当刘备的老婆。这是因为当曹操的手下说不定哪天就被杀头了,当刘备的老婆说不定哪天就被抛弃了。陈寿在《先主传》与二主妃子传里面说,刘备的妻子被吕布……日本人形美术贵族玩物源于江户时代日本人形制作艺人广州交流很多去日本旅游的游客,都会被当地造型优美、制作精良的人形所吸引。作为日本传统的民间美术,人形美术大约起源于日本的江户时代。经过数百年的发展,以其精……游路看人甲:哟,X老师,可有日子没见着您,最近忙什么呢?乙:这不十一长假么,我领着老婆、孩子出去旅旅游。甲:哟,X老师,您出门儿了?乙:是。甲:去了好地方?……女性容易出现性冷淡的年龄现在人们更年期提前的比比皆是,不知道大家有没有看过那个电影,叫做我的早更女友。更年期女人脾气暴躁,难以相处的比比皆是,让人头疼不已,而且让患者本人也十分的郁闷。而且还有一点让战……埋点到底要不要源自数据采集的痛苦幻想与失望随着移动互联网时代的兴起和数据量的大规模爆发,越来越多的互联网企业开始重视数据的质量。在我创业的这一年里,接触了200多家创业型公司,发现如今的企业对数据的需求已经不仅仅局限于……火炬花的养殖方法火炬花在养殖过程中,可选用煤渣、田园土和腐叶土配成营养土,在生长期间要每天保持有6~7个小时的光照处理,不可放在荫蔽处,越冬的温度不低于5,每隔1~2天浇水一次,冬季浇水要浇透……公司战略管理品牌化的管理思维方式企业是市场竞争的主体单位,有了企业才可能有产品和品牌。因此,我们研究市场竞争的时候,必须从企业的核心公司战略管理选择入手,抓住企业竞争的核心本原。即对企业各种核心竞争手段的思考……蜜蜂蛋群是什么意思工蜂是蜂群中最主要且数量最多的蜂型,正常蜂群一般有数万甚至十数万只工蜂,但有些蜂群因种种原因可能只有几百只工蜂,这种超级弱群就是养蜂人常说的蛋群,下面我们就一起来看一看蜜蜂蛋群……福寿螺到底能不能吃螺蛳肉是不少地区特别受欢迎的一种螺肉,我们主要吃的还都是田螺。还有一种螺和田螺很像,就是福寿螺,但是福寿螺据说是含有寄生虫的,这也并不是空穴来风,十几年前就有因为吃了福寿螺感染……空调漏水用嘴吹通后还会堵吗我们都知道,空调是比较常见的一种家用电器,它的制冷效果很不错,用起来很方便,深受人们喜欢。有些人在用空调的时候会发现空调漏水,那么空调漏水吹排水管有没有用呢?下面让我们具体来看……董欣懒人珍珠膏怎么样董欣懒人珍珠膏使用测评董欣珍珠膏,美白、淡斑、隔离!不是BB,完全可以代替BB,不会堵塞毛孔,滋生粉刺,推荐董欣这款防晒霜,对于懒人,涂了防晒霜不想卸妆的人,这款特别适合,一起来看看本站测评吧!……浪客行女主开的红色车什么牌子浪客行秀智同款车型号韩剧《浪客行》裴秀智扮演的女主是一个双面间谍,在剧中她开的红色SUV就是吉普牧马人,被改装过,拉风又好看,很亮眼。那么,秀智同款牧马人车多少钱呢?让我们一起来看看吧!浪客……
我想分手了我很累说说心累想分后的说说短句子能做到这两点才是职场最大的稳定游戏作者创业故事我的游戏为什么会火妻妾成群主要内容妻妾成群读后感经典语录白色帆布鞋的清洗方法吃什么可以延缓衰老呢网上有什么赚钱方法如何在家就可以兼职赚钱的方法原创池横随笔讷讷生命旅途女性颁奖典礼总是乱发失仪哪个发型最能保持完美造型有哲理的话伤感线下创业赚钱有哪些好项目我烦着呢
史上最全的社群运营促活技巧合集(干货)这也是一种美作文700字小学教育工作计划做小偷的N条理由调理肝脏应该多吃什么七问目标管理个人车辆出租合同手机imei查定位(怎么定位手机位置)茶花烟熏妆有哪几个特点烟熏妆适合什么场合高考祝福语:微笑属于你热闻聚热点网 钢筋购销合同

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找菏泽德阳山西湖州宝鸡上海茂名内江三亚信阳长春北海西安安徽黄石烟台沧州湛江肇庆鹤壁六安韶关成都钦州