CDA数据分析师出品 2月6日夜,北京下了一场大雪。 成立已13年的IT职业教育机构兄弟连教育创始人李超发布《致兄弟连全体学员、员工、股东的一封信》,正式宣告品牌破产。 兄弟连教育成立于2007年,曾是国内最大的PHP培训学校。但即使是营收破亿,挂牌新三板,这家教育企业最后还是没能抵抗住2020年疫情带来的资金链断裂,倒下了。 而近年来,不仅是像兄弟连这样曾经的培训巨头,王思聪的熊猫直播,昔日的宅男神器快播,成立23年的韦博英语像这样曾经有过高光时刻,最终黯然倒下的企业还有很多很多。 今天就给大家盘一盘,近年来在风口起落的背后,那些倒下的公司们。 Showmedata,用数据说话 今天我们聊聊那些年倒闭的公司 点击下方视频,先睹为快: IT桔子出了个死亡公司数据库,统计了20002020年之间,中国新经济领域这些年倒闭的创新创业公司。 截止2020年2月29日,共有6286家倒闭公司在IT桔子数据库中被标注为已关闭。这些公司中不乏被风口吹起来的猪,也不乏运营多年已然成长为估值超过10亿元的千里马、甚至10亿美金估值的独角兽。 我们用Python爬取并选取了近十年(20102020)5789家公司的数据,企图一窥这十年来创业公司的消亡史。 数据获取 我们获取IT桔子新经济死亡公司相关数据。 https:www。itjuzi。comdeathCompany 需要抓取的字段主要如下: 经过对网页进行解析,我们发现所爬取的网页是通过Ajax方式加载的,就直接使用浏览器抓包,拿他后面传输数据的文件。 API地址如下: https:www。itjuzi。comapiclosure?page1catid 其中page参数就代表页面,得到了API地址,下面就可以开始爬虫了。 爬虫流程如下:使用requests库发起网页请求,得到的数据通过json进行解析,存入列表中,利用循环得到630页的信息,代码如下: 导入所需库 importnumpyasnp importpandasaspd importrequests importtime importjson importrandom fromfakeuseragentimportUserAgent 创建空列表 comname〔〕公司名 closedate〔〕关闭时间 borndate〔〕成立时间 catname〔〕行业 secatname〔〕子行业 comprov〔〕地点 statusname〔〕获投状态 livetime〔〕存活时间 totalmoney〔〕融资金额 closuretype〔〕死亡原因 循环获取 foriinrange(1,631): 获取URL urlhttps:www。itjuzi。comapiclosure?page{}catid。format(i) 添加headers headers{useragent:UserAgent()。random} 发起请求并解析数据 try: rjsonrequests。get(url,headersheaders,timeout5)。json() exceptException: time。sleep(3) rjsonrequests。get(url,headersheaders,timeout5)。json() 获取数据 fordatainrjson〔data〕〔info〕: comname。append(data〔comname〕) closedate。append(data〔comchangeclosedate〕) borndate。append(data〔born〕) catname。append(data〔catname〕) secatname。append(data〔secatname〕) comprov。append(data〔comprov〕) statusname。append(data〔comfundstatusname〕) livetime。append(data〔livetime〕) totalmoney。append(data〔totalmoney〕) closuretype。append(〔i。get(name)foriindata〔closuretype〕〕) 打印进度 print(我正在获取第{}页的信息。format(i),end) 休眠 time。sleep(random。uniform(2,3)) 最后使用dataframe保存数据,结果展示如下: 保存数据 dfpd。DataFrame() df〔comname〕comname df〔closedate〕closedate df〔borndate〕borndate df〔catname〕catname df〔secatname〕secatname df〔comprov〕comprov df〔statusname〕statusname df〔livetime〕livetime df〔totalmoney〕totalmoney df〔closuretype〕closuretype df。head() 以下是具体分析结果: 01:hr2017年公司倒闭潮 超过一半的公司活不过3年 大家常说1998年是中国互联网元年,2010年是移动互联网的风口元年。尤其是2010年的移动互联网实在是太热闹了。小米、美团、爱奇艺等都在这一年相继成立。 诞生公司年份 我们分析了公司倒闭数据发现,2013年和2014年是新公司诞生的井喷年,出现的新公司最多,分别为2013年1342家,2014年的新公司1408家。 倒闭公司年份 与此相对的是,2016年和2017年出现的公司倒闭潮。其中,2016年倒闭的公司为1452家。而2017年一年倒闭的公司就超过2千家,达到2144家。要知道去年2019年破产的公司仅为338家。 倒闭公司月份走势图 细看公司倒闭的时间段可以发现,有四个公司倒闭数量的高峰月份。分别是2015年的7月,倒闭662家;2016年8月为787家;2017年8月为720家;2017年12月为822家。 倒闭公司存活时间分布 通过公司存活时间直方图可以发现:存活时间符合右偏分布,这些创业公司的存活天数大多集中在5462246天,50的分位数对应的值是1122天。也就是说,有超过一半的公司都未撑过3年。 综上分析,先是在2013、2014年迎来巨大的公司诞生潮,在三年后的2016、2017年迎来公司相继倒闭潮,真是让人唏嘘不已。 02:hr北上广不相信眼泪 倒闭公司数量居前三 倒闭公司省份分布 倒闭公司都在哪些地方呢?这次北上广再次领跑,北京最多,高达2242家,其次是广东,有1097家;上海倒闭的公司有1035家,排在第三。果然北上广不相信眼泪,机会诞生最多的地方,同样会伴随着多少梦想的陨落。 同时也作为创业公司聚焦的浙江倒闭公司也很高,为397家。江苏、福建等沿海城市倒闭公司数量也较高;同时四川也有近三百家创业公司倒闭。 03:hr电商、企业服务 为公司倒闭的重灾区 倒闭公司行业分布 在倒闭公司的行业方面,电子商务是最多的,达到925家。就在2019年7月底,成立9年的尚品网再度卷入裁员风波,不久宣布倒闭;8月,主持人李静创立、唯品会斥资1亿美元拿下的的明星美妆电商平台乐蜂网关停。 其次是企业服务类,为813家。其次金融、社交领域的倒闭公司也不在少数,分别达到512家和499家。 金融领域的大批公司倒闭这一点也不难理解,随着国家对互联网金融,尤其是P2P网贷的整治力度逐渐加大,从近两年开始,大批P2P平台被查处,另外还有一大批进行良性退出。去年下半年,湖南、山东等多个省市金融监管部门相继取缔不合格P2P平台,即使是曾经在互金圈内享有盛名的平台也免不得爆雷。 04:hr倒闭企业名单 五成以上公司未获融资 倒闭公司获投状态 融资失利,的确成了压死创业公司的最后一根稻草。 经过分析可以看到,在破产公司中,近一半的公司获投情况不明确。其中28。65的公司尚未获投。其余剩下的公司从融资轮次来看,多集中在天使轮和A轮。获得天使轮的仅占8,A轮仅3。9。 05:hr商业模式匮乏 是企业倒闭的主要原因 在这些年倒闭的企业中,无论它们曾经是否辉煌,现在都已经有了结局。它们之中,有的因为商业模式不明确而倒下,有的因为管理运营问题而结束,有的则死在了政策红线面前 我们分析了其中部分公司的具体死亡原因统计显示:商业模式、行业竞争、市场伪需求是导致公司倒闭的主要原因。 其中多达477家公司都因为商业模式匮乏而倒闭,占比近五分之一的。公司在长期发展中,若缺乏对企业盈利模式、市场定位等方面的思考,也难逃倒闭的风险。 其次是行业竞争,因此倒闭的公司多达363家。尤其是各种因风口而催生的行业及这其中诞生的创业公司。比如2015年O2O大战的外卖行业;2016年的各种共享经济类型的企业。 因为市场伪需求而倒闭的公司也不少,有217家。它们之中,有的瞄准的市场过于分散,还未形成市场效应;有的则没有解决市场痛点,不痛不痒的创造用户不需要的需求。 结语: 这是一个最好的时代,也是一个最坏的时代,一批创业者正踏上天堂之路,一批创业者正走向地狱之门,创业的道路上致使失败的原因太多,如同蝴蝶效应一样,一个小小的问题,最终可能导致失败。创业不易,且行且珍惜! 作者:Mika