关系经济人类预测化学自然
投稿投诉
自然科学
知识物理
化学生物
地理解释
预测理解
本质社会
人类现象
行为研究
经济政治
心理结构
关系指导
人文遗产

肖文峰技术饱和人本数据与数据工程平民化

6月18日 醉殇别投稿
  2011年的中国互联网正处于移动互联网快速发展的热潮之下,TalkingData正是在这样的背景下创建的。六年发展以来,中国互联网的风口变化了多次从云计算、大数据、IoT到人工智能,无数公司在一轮又一轮的淘汰中落马,而TalkingData则在传统行业中找到了自己的价值,已经成为国内企业级数据服务行业中的一线玩家。
  2016年开始,TalkingData做了一系列动作幅度颇大的结构调整,把所有的业务单元拆分成三个事业部数据商业化单元、数据交易单元以及数据应用合作单元,并设置了F连作为与客户紧密合作的项目实施团队。人工智能技术的发展,首当其冲的就是数据相关业务。作为一家靠数据吃饭的企业,TalkingData对于当前的数据业务形态有怎样的看法?对于人工智能技术在这一年的发展有何动作?我们邀请到TalkingDataCTO、EGO会员肖文峰先生为我们分享他的视角。
  更多干货内容请关注微信公众号:AI前线,(ID:aifront)
  嘉宾简介
  肖文峰,TalkingDataCTO,1978年生,清华大学硕士,曾就职于朗讯、BEA甲骨文和微软,担任软件研发和研发管理工作。后经过一段时间创业,于2013年加入奇虎360负责无线端产品线。2014年加入TalkingData任CTO,负责全业务线的研发工作。
  首先,请介绍一下您这边最近一年的主要变化与达成的目标?
  肖文峰:最近一年主要是团队方向调整。最近整个行业发生了一些变化:TalkingData的主要客户是一些传统企业,我们帮助他们做移动互联网和大数据的转型。以前,行业里做企业服务的模式可能停留在交付完产品就结束了,但客户的问题未必真的解决了,这些交付的产品客户未必真的用起来了。所以在这个时候我们觉得有必要多做一些,力图突破一些行业的固有模式,去真正帮客户解决问题,去和客户建立成效合作伙伴的关系,我们称为ROIP。我们致力于成为客户的合作伙伴,以效果为导向,对客户最后的结果负责,客户有效果、有收益,我们才有价值、才有营收。
  当然,做这样的事情需要客户的高度配合。并不是所有的客户都适合这么做,企业高层要完全理解数据产生的价值,要全力支持才行,因为,往往这样的项目都涉及到客户内部不同部门之间的数据打通。只有打破了部门墙,我们才能把这些数据融合起来,让数据产生价值。
  藉此,我们重新规划了目标,调整了团队。我们也在尝试新的服务方式和协作方式,以适应客户的需求,这在我们内部称为F连。
  F连是由什么人组成的?
  F连就是面向解决客户问题的特殊团队,一个团队里面可能包括数据工程师、数据科学家、数据分析师等不同角色的五六个人。我们对于每种角色,都希望有一些基础能力:统计分析、数学能力、编程能力、理解客户需求的能力以及沟通能力。我们认为所有人都应该有一些共同的基础,只不过不同的职业分工在某些能力上有偏重,大体上看:
  数据分析师偏向沟通、业务领域知识理解;
  数据科学家偏向于算法;
  数据工程师偏向于编程;
  数据架构师偏向于数据本身维度、质量方面的理解。
  在这个层面上,我们希望每个人都往相对全栈的方向发展,这样在面对用户现场的复杂环境的时候,少数几个人就能够帮助客户解决问题。否则,动不动遇到一个问题就需要呼叫后方资源,效率较低,成本较高,回报很难平衡。
  我们最近也在设置了专门的培训课程,支持每个职业规划的知识更新换代,目的就是为了把所有人往各自的职业赛道上推得更深一些,让员工能更快适应新需求、新技术等的变化。
  现在业界没有比较好的培训课程吗?
  肖文峰:没有看到比较系统化并完全适合我们需求的。所以我们也在整理TalkingData的实践经验,将之整理成为课程,并和国内外一些院校合作,优化课程内容。自己在做内训的同时,未来也会逐步把这些课程开放出去。
  在以前,懂业务是IBM、埃森哲这样的老牌公司的优势,而初创企业尤其是技术背景的初创企业因为缺乏业务经验,就很难在这方面对接客户的需求。现在,在这个层面上的toB新兴技术公司似乎越来越活跃了。您觉得这种变化是为什么?
  肖文峰:大企业选择一个供应商,最看重的不一定是价格,可能更多是这个供应商有多少承担风险的能力,而小公司承担风险的能力相对还是比较差的。所以大公司始终会需要实力足够强、品牌足够好的供应商,这并不会因为时代而变化。
  现在有什么不一样呢?随着基础技术的发展,比如云计算技术、容器技术,降低了创新的门槛,小公司不再需要从头构建自己的技术,可以基于行业已有的稳定框架和服务很快搭建出产品,具有相当程度的稳定性和抗风险能力,所以更容易被大企业接受。
  在AI方面,今年有您比较关注的技术更新吗?
  肖文峰:AlphaGoZero对我们的触动还是比较大的。以前这种深度学习或者监督学习,都需要海量的数据。但是AlphaGoZero让大家发现,在具备一定规则的情况下,不需要那么多的数据练习,可以抛开人类标注的训练集,自行通过学习来产生更大的能力。我觉得这可能会产生革命性的影响。
  另外一个对我们相对有影响的是TensorFlow发布了TensorFlowLite,为移动端提供了人工智能能力。TensorFlowLite为开发者提供了更多提升用户体验的武器,会刺激更多手机端智能化场景的创新,这也是很有价值的。
  从业务角度来看,面向客户需求的话,您觉得AI技术的更新给他们的业务带来的好处有多大?
  肖文峰:AI技术的更新对于客户来说好处肯定很多,会带来更好的用户体验,带来更多的业务拓展的机会,带来工作效率的提升和成本的节省,等等。AI能力会成为未来企业的核心竞争力,这也是很多客户的认知。
  甚至今年我们看到一个趋势,就是客户也在开始自建大数据团队和AI团队。就和当年的信息化一样,当企业大到一定程度以后,AI团队会变成像IT部门一样的服务部门。大数据能力和AI能力会逐渐变成公司基础能力的一部分,为所有部门提供支持。
  同时,现在很多甲方企业也在研发自己的智能客服系统。当然,智能客服的门槛未必很高,相当一部分挑战在于找到与企业应用场景匹配的语料训练集。而企业本身就在场景中积累了这些训练数据集,也更加了解自己的业务场景,所以训练出来的效果可能会比通用的智能客服更好。
  所以对于AI创新企业来说,未来可能更多扮演赋能的角色,而不是提供整体解决方案。所谓赋能,就是为客户提供更好的核心算法引擎,让客户可以基于这个算法引擎做定制化开发,在此基础上搭建符合自身需要的算法能力。
  能否简单介绍一下TalkingData如何划分数据科学领域的技术栈?
  肖文峰:数据科学是一门实践性的新型学科,横跨计算机科学、统计学、数学、软件工程和行业知识等多个领域,往往很难给出一个明确的定义。我们的数据科学团队在今年梳理了数据科学家需要具备的能力。我们认为,作为一个合格的数据科学家,在技术上肯定有较高的要求需要有一定的数据基础,有机器学习算法的理论知识,有一定的编程架构工程的能力。但是技术只是数据科学家的一个维度而已,他还需要很强的业务理解的能力,必须对问题所在领域的知识有充分的掌握和理解,例如做金融大数据的,那么就需要理解金融行业里各种各样的专业词汇所代表的含义。同时,还需要有很强的沟通和协作的能力,这样才可能准确理解和定义遇到的问题。我们内部也是通过这些能力给数据科学家定级以及评分的。
  你觉得AI未来会取代人类吗?
  肖文峰:其实大数据只是数据维度和类型发生变化,大家对数据的使用模式并没有发生变化,仍是数据采集、加工处理、最后产生决策这一套流程,只不过有些可能是人工的,有些是靠机器实现的。有了人工智能以后,它可以帮助人们更快完成从数据到决策的过程。
  我觉得最后做决策的还是人,人工智能永远都无法代替用户做决策。这是我的观念,因为我觉得大家做事情并不只是为了机械性地去满足一个规则。比如人不会因为有了自行车就不再跑步了,因为跑步除了单纯锻炼身体,还有释放潜能、超越自我的意义。算法在技能上可能超越围棋冠军,但是在艺术层面,不可能达到人的水平。例如,一个放贷系统,如果站在算法层面看,不会贷款给一个穷人,因为风险很高;但如果站在人文关怀、同理心和同情心的角度来讲,有可能就会贷款给他,给他带来新的希望,国家社会也会变得更好一些。如果单纯靠算法,那我觉得这社会就太苍白,没什么意义了。所以,人要跟机器结合在一起,才能有更好的结果。技术再强,也有人文的立足之地。
  TalkingData也在研究人文吗?
  肖文峰:对。TalkingData2011年成立,在国内最早做统计分析平台。现在我们是国内最大的独立第三方移动数据服务平台,平均月活跃用户超过7亿。现在我们的数据科学部门就在利用这些数据做一些基础研究,比如通过标注建筑中的WiFi有多少公共的、多少是商业的、多少是私人的,体现出建筑商业化程度的变迁。也能通过社区之间人群的迁移,以及人群的工作地、居住地、娱乐地、收入水平、消费能力等多维度的能力,来反映社区的发展趋势和规律。我们专门成立了人本实验室,与像MIT这样国际顶尖学府的实验室合作进行人本层面的研究,希望从以人为本的角度来理解数据、使用数据。
  您觉得你们现在做的这种数据服务,能多大程度做到客户完全自助,从而可以加速规模化的程度?
  肖文峰:传统的数据服务,存在一个很大的问题就是,懂数据的人不懂业务,懂业务的人不懂数据,业务部门和IT部门之间存在很大的鸿沟,会导致很多资源和时间消耗在反复的沟通和确认上。所以现在我们更多在研究如何加强数据工程和数据科学的平民化,让更多的人不需要那么强的知识背景也能够去理解数据和使用数据,这就需要对数据服务中的各个环节进行智能化的改造,以及对产品的用户交互体验进行优化。因此,完全的客户自助可能比较困难,但是肯定能大大提升客户的自服务水平。
投诉 评论 转载

恃宠而骄读后感摘抄《恃宠而骄》是一本由〔美〕杰西艾森伯格著作,人民文学出版社出版的精装图书,本书定价:59。00元,页数:176,特精心从网络上整理的一些读者的读后感,希望对大家能有帮助。……肖文峰技术饱和人本数据与数据工程平民化2011年的中国互联网正处于移动互联网快速发展的热潮之下,TalkingData正是在这样的背景下创建的。六年发展以来,中国互联网的风口变化了多次从云计算、大数据、IoT到人工……故乡之景我的故乡在南方,那儿没有所谓的江南水乡,只有一片绿油油的茶,而故乡最出名也是茶,我最喜爱的也是茶的香气。初秋的清晨,我从家中出去游玩。我向家乡的小山走去,很快进入山中。岚……中考优秀作文把握自己俗话说得好,一分耕耘,一分收获。你比别人多一分努力,你比别人就会多一分收获。相信这是谁都明白的道理。可事实上,大伙都一味地寻找捷径,可学习是没有什么捷径可走的,必须脚踏实……等待夏日时节的收获初三作文汗水为成功奠基,拼搏为明日增彩!题记又是一年金秋来临,又是一年硕果累累,带着懵懂,负着期许,载着希望,启动初三的巨轮,扬帆远航!开学第一天,忙碌,忙碌,再忙碌……当今世界上最高的人盘点中国袁帆米破纪录前纪录米在你的映像和记忆当中你说知道的世界上身高最高的人是谁?我想大部分人会认为是2。26米的姚明、知识面更广泛的人可能知道张俊才、鲍喜顺、苏尔坦科森等人,但是最高的其实并不是这几人,……马与人马和人一样,都是地球上的一种生物。今天,我们观看了战马,1914年,在德文郡小镇,男孩艾尔伯特,目睹了幼驹乔伊的诞生。在集市上,它被频繁叫价,最终被艾尔伯特的父亲泰德,用……原因造句用原因造句大全(181)经理明察秋毫,即使我不说事情的原因,他也知道底细。(182)三国时魏的嵇康、阮籍优游竹林,放浪形骸,是有他们的特定的政治原因的。(183)对这次事件,我们……新衣服英语作文MyNewClothesWhenthefestivalcomes,Ialwaysgetsomegiftsfrommyparents,sometimesIgettoys,sometimesIgetsna……春雷轰隆隆!轰隆隆!谁来了?雷公公。他,从初春的云空赶来,又走向远方的山谷中。轰隆隆!轰隆隆!他,把小青蛙从冬眠中喊醒,催蚕姑娘去丝织厂上工。小蚯蚓听到呼唤,又去耕地,迎接播种;小……多多未必益善700字作文书读得多可以高谈阔论,知识积累得多可以立足于社会,但在我们的现实生活中并非什么都是越多越好。万事都需要讲个度。比如钱。挣取固然是好,但人不是为钱而活,整日奔忙下来真正得到……为了自己的梦想优秀作文500字为了自己的梦想,学习雏鹰飞向天空的坚强。下面是小编整理的为了自己的梦想初中500字优秀作文,供大家参考!为了自己的梦想500字篇1尘世间,或许一切都是灰蒙蒙的,只有……
二年级叙事作文有趣的一件事高二叙事作文因为有你任盈盈的性格怎么样任盈盈属于什么性格围棋比赛作文800字为学杯A组难忘的第一次中国的小皇帝麻雀排队原型设计单读原型分享家乡新变化您也有很多宝宝防晒问题吗这里有你想要的答案乐和造句用乐和造句大全两款产后脱发调养药膳方
如何自制健康环保的驱蚊水我该怎么办?流水的MCN,流水的直播间,赚钱的都是装修公司?留守儿童的安全问题更应该引起重视工资扣税怎么算?今年夏天流行什么款式的连衣裙连衣裙穿搭技巧千万不要随便让爸妈养宠物,否则简直大型真香现场哈哈哈哈ppt音乐怎么一直播放(制作ppt是怎么按顺序出现内容)VIVO手机如何开启或关闭来电闪光灯提醒全家都满意的女孩名字,个个都非常好听且独特下半年宏观经济政策的两难选择土地使用证抵押登记流程是什么?

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找菏泽德阳山西湖州宝鸡上海茂名内江三亚信阳长春北海西安安徽黄石烟台沧州湛江肇庆鹤壁六安韶关成都钦州