作者:朱小五

来源:凹凸玩数据

在开始正文前,首先介绍下首届“森麟杯”数据分析大赛,详情可以戳:参与首届“森麟杯”数据分析竞赛,分享千元红包


前段时间老罗和王校长都成为自己的创业公司成了失信人,小五打算上IT桔子看看他们的公司。

意外发现IT桔子出了个死亡公司库(https://www.itjuzi.com/deathCompany),统计了2000-2019年之间比较出名的公司“死亡”数据。

小五利用python将其中的死亡公司数据爬取下来,借此来观察最近十年创业公司消亡史。

获取数据

F12,Network查看异步请求XHR,翻页。

成功找到返回json格式数据的url,

https://www.itjuzi.com/api/closure?com_prov=&fund_status=&sort=&page=1

不了解json的读者可以看【python玩转Json数据】,部分爬虫代码(完整代码见文末下载地址):

def main():    data = pd.DataFrame(columns=['com_name','born','close','live_time','total_money','cat_name','com_prov','closure_type'])    for i in range(1,2): #设置爬取N页        url= 'https://www.itjuzi.com/api/closure?com_prov=&fund_status=&sort=&page='+ str(i)        html = requests.get(url=url, headers=headers).content        doc = json.loads(html.decode('utf-8'))['data']['info']        for j in range(10): #一页10个死亡公司            data = data.append({'com_name':doc[j]['com_name'],'born':doc[j]['born'],'cat_name':doc[j]['cat_name'],                    'closure_type':doc[j]['closure_type'],'close':doc[j]['com_change_close_date'],'com_prov':doc[j]['com_prov'],                    'live_time':doc[j]['live_time'],'total_money':doc[j]['total_money']},ignore_index=True)            time.sleep(random.random())    return data

成功获取6271家死亡公司数据。

数说10年生死相

截止 2019 年 11 月 24 日,共有近6271家公司在 IT 桔子数据库中被标注为“已关闭”,我们挑选最近十年(2010-2019)的5765家公司,来看一看这十年,创业公司的消亡。

大家常说1998年是中国互联网元年,2010年是移动互联网的元年。

也难怪,2010年的移动互联网实在是太热闹了。微信、小米、美团、爱奇艺等都在这一年相继成立。

百度在谷歌退出中国后成为最大的受益者,淘宝成为阿里新的增长点,腾讯则宣布QQ同时在线超1亿人。自此,百度、阿里和腾讯正式成为“三巨头”——BAT。除此之外,网易的网游、新浪的微博、搜狐的视频和输入法也开始发力出击,移动互联网的竞争正式拉开帷幕。

2010 年来,历年出生及死亡的公司数量趋势如下图。

2013、2014 年是公司诞生潮,三年后,正好对应了2016、2017的一波死亡潮。在2017 年,超过 2000 家公司倒闭。

在这十年间,诸多“风口”起起伏伏。网约车、团购、直播、基因检测、共享单车、短视频、比特币、VR|AR、无人货架、人工智能、直播带货……

每一个风口上,都站着数百头“猪”,试图借力分一杯羹。

百团大战、垂直电商大战、外卖大战、打车大战、单车大战,在这些著名的战场里,各种桥段令吃瓜群众们目不暇接。有老大老二打架,老三打没了;有老二老三合并,继续和老大抗衡的;也有老大老二合并,将其他家远远甩在后面的……

还有像冲顶大会之类直播答题一样,办起来的时候,各家分庭抗礼来势汹汹,却从2018年的公历新年开始,没有挺到农历新年。

风口消亡的背后,是无数创业公司烧掉的钱,每个公司在一开始,都坚信可以烧倒对手,但烧着烧着把自己烧光了,却再也拿不到融资。

2019 年 3 月,团贷网的暴雷让这家曾拿过约 25 亿融资的 P2P 公司登上烧钱榜TOP1的宝座,同属于一个实控人唐军的小黄狗一个月后也在此汇合。

当年的爱屋吉屋在互联网+的热潮中,试图用互联网颠覆传统房产中介,但在线下房地产产业规则面前跌了一个大大的跟头。而专注深耕线下房产交易多年的链家,在时机成熟后推出的“自如”与“贝壳”,则不断得到了投资方的追捧。

而将王思聪拖到“老赖”深渊的熊猫直播,曾在成立后仅一年的时间内,就跃居行业第三,后续更是完成多轮融资,一时风头无二。但在短视频行业的兴起,与运营成本的水涨船高后,也逐步走向衰亡。

共享单车们也曾大战一场,战火烧过国内的各大城市,甚至烧到了海外。先倒下的酷骑单车虽然只在烧钱榜单名列第8,但是凭借着一年多(379天)烧掉了融资的10亿元,日均烧钱263.85万元,荣登最快烧钱榜首。

创业公司的消亡,究其原因必然是多方面的,除行业竞争激烈这一核心因素外,最主要的还是商业模式的匮乏。创业者内在对于如何维稳、如何盈利等方面欠缺的了解、思考与准备,不足以在行业稳定后,支撑他在风口来临之初的一腔热血豪情。

另外,“伪风口”与“伪需求”也曾迷住众多创业公司的眼。“共享经济”衍生出的共享单车、共享充电宝红红火火,但共享电话、共享厕纸、共享篮球什么的,倒也不必。

比较有意思的是,这个死亡公司数据库还加了一个#上香排行榜#,排行第一的果然是大名鼎鼎的“快播”。

还真是有的公司死了,(在人心里)他还活着;

有的公司活着,(在人心里)他已经死去。

比如说。。。

相关爬虫源码已上传github:https://github.com/zpw1995/aotodata/tree/master/interest/6217

作者:朱小五,互联网公司数据分析师。热衷于Python爬虫,数据分析,可视化,个人公众号《凹凸玩数据》,有趣的不像个技术号~

◆ ◆ ◆  ◆ ◆



长按二维码关注我们


数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。

管理员二维码:

猜你喜欢● 笑死人不偿命的知乎沙雕问题排行榜● 我用Python纪念了那些被烂片收割的智商税!● 互联网大佬学历&背景大揭秘,看看是你的老乡还是校友● 上万条数据撕开微博热搜的真相!● 你相信逛B站也能学编程吗?     

Python爬取6271家死亡公司数据,一眼看尽十年创业公司消亡史!相关推荐

  1. Python 爬取 6271 家死亡公司数据,一眼看尽十年创业公司消亡史!

    作者 | 朱小五 责编 | 刘静 前段时间老罗和王校长都成为自己的创业公司成了失信人,小五打算上IT桔子看看他们的公司. 意外发现IT桔子出了个死亡公司库(https://www.itjuzi.com ...

  2. 爬取6271家死亡公司数据,看十年创业公司消亡史

    戳蓝字"CSDN云计算"关注我们哦! 作者 | 朱小五 责编 | 阿秃 前段时间老罗和王校长都成为自己的创业公司成了失信人,小五打算上IT桔子看看他们的公司. 意外发现IT桔子出了 ...

  3. 租房不入坑不进坑,Python爬取链家二手房的数据,提前了解租房信息

    目录 前言 一.查找数据所在位置: 二.确定数据存放位置: 三.获取html数据: 四.解析html,提取有用数据: 前言 贫穷限制了我的想象,从大学进入到社会这么久,从刚开始的兴致勃勃,觉得钱有什么 ...

  4. python 爬取链家成交房数据案例

    爬取链家网流程为request.get得到网页信息,将得到的信息放入BeautifulSoup,再调用select爬取所需信息,用re正则表达式进行更细的筛选,用strip过滤无用字符串.具体代码如下 ...

  5. python爬取链家网的房屋数据

    python爬取链家网的房屋数据 爬取内容 爬取源网站 爬取内容 爬取思路 爬取的数据 代码 获取房屋url 获取房屋具体信息 爬取内容 爬取源网站 北京二手房 https://bj.lianjia. ...

  6. 掌财社:python怎么爬取链家二手房的数据?爬虫实战!

    我们知道爬虫的比较常见的应用都是应用在数据分析上,爬虫作为数据分析的前驱,它负责数据的收集.今天我们以python爬取链家二手房数据为例来进行一个python爬虫实战.(内附python爬虫源代码) ...

  7. python 爬取链家数据_用python爬取链家网的二手房信息

    题外话:这几天用python做题,算是有头有尾地完成了.这两天会抽空把我的思路和方法,还有代码贴出来,供python的初学者参考.我python的实战经历不多,所以代码也是简单易懂的那种.当然过程中还 ...

  8. python爬房源信息_用python爬取链家网的二手房信息

    题外话:这几天用python做题,算是有头有尾地完成了.这两天会抽空把我的思路和方法,还有代码贴出来,供python的初学者参考.我python的实战经历不多,所以代码也是简单易懂的那种.当然过程中还 ...

  9. 如何使用python编程抢京东优惠券 知乎_学好Python爬取京东知乎价值数据

    原标题:学好Python爬取京东知乎价值数据 Python爬虫为什么受欢迎 如果你仔细观察,就不难发现,懂爬虫.学习爬虫的人越来越多,一方面,互联网可以获取的数据越来越多,另一方面,像 Python这 ...

最新文章

  1. 4次优化,我把 Redis 性能 “压榨” 到极致!
  2. 如何让低版本IE浏览器支持HTML5和CSS3
  3. kindeditor编辑器使用七牛云上传图片
  4. java nio 面试题_10个最高频的Java NIO面试题剖析!
  5. python做excel自动化-python操作excel让工作自动化
  6. Tomcat详解(六)——Tomcat运行模式调优
  7. 【紫书第六章】链表(list)、栈和双向队列(deque)
  8. 学习笔记之Python的六种内置对象
  9. VSCode PIO创建工程失败分析和解决办法
  10. 王垠 java,王垠,40行代码,JAVA吧的大神怎么评论?
  11. [py] 考拉兹猜想
  12. Android集合之SparseArray、ArrayMap详解
  13. 基于Pytorch实现猫狗分类
  14. (附源码)基于SSM框架的图片分享及评价网站设计与实现 毕业设计201524
  15. 交大计算机技术非全日制,上海交通大学非全日制研究生的区别
  16. 问题:The given artifact contains a string literal with a package reference 'andro
  17. mysql不是内部批处理文件怎么解决,mysql不是内部或外部命令也不是可运行的程序或批处理文件...
  18. 为什么会一闪而过 c语言程序,为什么程序运行后会一闪而过呢[求助]
  19. Adjust接入记录
  20. implode()函数和explode()函数

热门文章

  1. Python-pptx Slides
  2. Android的读写文件权限
  3. 管家婆批量收款:提高收款效率的新功能
  4. 魅族怎么更改html,魅族默认浏览器设置
  5. 计算机桌面怎么换服,台式电脑怎么换桌面壁纸
  6. vivo7.0系统手机最完美激活Xposed框架的教程
  7. 不同系统下的shell的不同_不同地区不同气候条件下杉木成材时间的区别
  8. echarts pie饼图的使用(初级版包括设置百分比)
  9. 微信小游戏开发实战教程3-绘制网格
  10. 百家争鸣,智能办公群雄论剑,吹响企服三会号角第一声