爬取6271家死亡公司数据,看十年创业公司消亡史
戳蓝字“CSDN云计算”关注我们哦!
作者 | 朱小五
责编 | 阿秃
前段时间老罗和王校长都成为自己的创业公司成了失信人,小五打算上IT桔子看看他们的公司。
意外发现IT桔子出了个死亡公司库(https://www.itjuzi.com/deathCompany),统计了2000-2019年之间比较出名的公司“死亡”数据。
小五利用python将其中的死亡公司数据爬取下来,借此来观察最近十年创业公司消亡史。
获取数据
F12,Network查看异步请求XHR,翻页。
成功找到返回json格式数据的url,
https://www.itjuzi.com/api/closure?com_prov=&fund_status=&sort=&page=1
不了解json的读者可以看【python玩转Json数据】,部分爬虫代码(完整代码见文末下载地址):
def main(): data = pd.DataFrame(columns=['com_name','born','close','live_time','total_money','cat_name','com_prov','closure_type']) for i in range(1,2): #设置爬取N页 url= 'https://www.itjuzi.com/api/closure?com_prov=&fund_status=&sort=&page='+ str(i) html = requests.get(url=url, headers=headers).content doc = json.loads(html.decode('utf-8'))['data']['info'] for j in range(10): #一页10个死亡公司 data = data.append({'com_name':doc[j]['com_name'],'born':doc[j]['born'],'cat_name':doc[j]['cat_name'], 'closure_type':doc[j]['closure_type'],'close':doc[j]['com_change_close_date'],'com_prov':doc[j]['com_prov'], 'live_time':doc[j]['live_time'],'total_money':doc[j]['total_money']},ignore_index=True) time.sleep(random.random()) return data
成功获取6271家死亡公司数据。
数说10年生死相
截止 2019 年 11 月 24 日,共有近6271家公司在 IT 桔子数据库中被标注为“已关闭”,我们挑选最近十年(2010-2019)的5765家公司,来看一看这十年,创业公司的消亡。
大家常说1998年是中国互联网元年,2010年是移动互联网的元年。
也难怪,2010年的移动互联网实在是太热闹了。微信、小米、美团、爱奇艺等都在这一年相继成立。
百度在谷歌退出中国后成为最大的受益者,淘宝成为阿里新的增长点,腾讯则宣布QQ同时在线超1亿人。自此,百度、阿里和腾讯正式成为“三巨头”——BAT。除此之外,网易的网游、新浪的微博、搜狐的视频和输入法也开始发力出击,移动互联网的竞争正式拉开帷幕。
2010 年来,历年出生及死亡的公司数量趋势如下图。
2013、2014 年是公司诞生潮,三年后,正好对应了2016、2017的一波死亡潮。在2017 年,超过 2000 家公司倒闭。
在这十年间,诸多“风口”起起伏伏。网约车、团购、直播、基因检测、共享单车、短视频、比特币、VR|AR、无人货架、人工智能、直播带货……
每一个风口上,都站着数百头“猪”,试图借力分一杯羹。
百团大战、垂直电商大战、外卖大战、打车大战、单车大战,在这些著名的战场里,各种桥段令吃瓜群众们目不暇接。有老大老二打架,老三打没了;有老二老三合并,继续和老大抗衡的;也有老大老二合并,将其他家远远甩在后面的……
还有像冲顶大会之类直播答题一样,办起来的时候,各家分庭抗礼来势汹汹,却从2018年的公历新年开始,没有挺到农历新年。
风口消亡的背后,是无数创业公司烧掉的钱,每个公司在一开始,都坚信可以烧倒对手,但烧着烧着把自己烧光了,却再也拿不到融资。
2019 年 3 月,团贷网的暴雷让这家曾拿过约 25 亿融资的 P2P 公司登上烧钱榜TOP1的宝座,同属于一个实控人唐军的小黄狗一个月后也在此汇合。
当年的爱屋吉屋在互联网+的热潮中,试图用互联网颠覆传统房产中介,但在线下房地产产业规则面前跌了一个大大的跟头。而专注深耕线下房产交易多年的链家,在时机成熟后推出的“自如”与“贝壳”,则不断得到了投资方的追捧。
而将王思聪拖到“老赖”深渊的熊猫直播,曾在成立后仅一年的时间内,就跃居行业第三,后续更是完成多轮融资,一时风头无二。但在短视频行业的兴起,与运营成本的水涨船高后,也逐步走向衰亡。
共享单车们也曾大战一场,战火烧过国内的各大城市,甚至烧到了海外。先倒下的酷骑单车虽然只在烧钱榜单名列第8,但是凭借着一年多(379天)烧掉了融资的10亿元,日均烧钱263.85万元,荣登最快烧钱榜首。
创业公司的消亡,究其原因必然是多方面的,除行业竞争激烈这一核心因素外,最主要的还是商业模式的匮乏。创业者内在对于如何维稳、如何盈利等方面欠缺的了解、思考与准备,不足以在行业稳定后,支撑他在风口来临之初的一腔热血豪情。
另外,“伪风口”与“伪需求”也曾迷住众多创业公司的眼。“共享经济”衍生出的共享单车、共享充电宝红红火火,但共享电话、共享厕纸、共享篮球什么的,倒也不必。
比较有意思的是,这个死亡公司数据库还加了一个#上香排行榜#,排行第一的果然是大名鼎鼎的“快播”。
还真是有的公司死了,(在人心里)他还活着;
有的公司活着,(在人心里)他已经死去。
比如说。。。
相关爬虫源码已上传github:https://github.com/zpw1995/aotodata/tree/master/interest/6217
福利
扫描添加小编微信,备注“姓名+公司职位”,加入【云计算学习交流群】,和志同道合的朋友们共同打卡学习!
推荐阅读:
中国5G智能终端明年或出货1亿部;Win10 20H1正式版有望明年春季发;腾讯云发布七大新品……
2019年技术盘点云数据库篇(二):阿里云携手MongoDB率先上线4.2数据库 云上数据库已是大势所趋
云+X案例展 | 民生类:纷享销客助力沃得农机构筑智能化、信息化之路
我在华为做外包的真实经历
图灵奖得主Bengio:深度学习不会被取代,我想让AI会推理、计划和想象
操作系统兴衰史
真香,朕在看了!
爬取6271家死亡公司数据,看十年创业公司消亡史相关推荐
- Python 爬取 6271 家死亡公司数据,一眼看尽十年创业公司消亡史!
作者 | 朱小五 责编 | 刘静 前段时间老罗和王校长都成为自己的创业公司成了失信人,小五打算上IT桔子看看他们的公司. 意外发现IT桔子出了个死亡公司库(https://www.itjuzi.com ...
- Python爬取6271家死亡公司数据,一眼看尽十年创业公司消亡史!
作者:朱小五 来源:凹凸玩数据 在开始正文前,首先介绍下首届"森麟杯"数据分析大赛,详情可以戳:参与首届"森麟杯"数据分析竞赛,分享千元红包 前段时间老罗和王校 ...
- 利用xpath爬取链家租房房源数据并利用pandas保存到Excel文件中
我们的需求是利用xpath爬取链家租房房源数据,并将数据通过pandas保存到Excel文件当中 下面我们看一下链家官网的房源信息(以北京为例) 如图所示,我们通过筛选得到北京租房信息 那么我们需要将 ...
- 租房不入坑不进坑,Python爬取链家二手房的数据,提前了解租房信息
目录 前言 一.查找数据所在位置: 二.确定数据存放位置: 三.获取html数据: 四.解析html,提取有用数据: 前言 贫穷限制了我的想象,从大学进入到社会这么久,从刚开始的兴致勃勃,觉得钱有什么 ...
- 巧用selenium爬取巨潮资讯公司数据
巧用selenium爬取巨潮资讯公司数据 立项背景:在做深度学习的过程中利用python进行建模,需要数据来训练模型. 项目目标:通过运用python的selenium模块,爬取巨潮资讯网站关于公司的 ...
- 爬取链家网二手房数据并保存到mongodb中
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 爬取链家网二手房数据并保存到mongodb中 文章目录 前言 一.爬虫的介绍 二.协程的介绍 三.css选择器 四.基于asyncio ...
- 爬取链家北京租房数据并做简单分析
在一个来北京不久的学生眼中,北京是一个神秘又充满魅力的大城市.它无比美好,但又无时无刻不再觊觎这你薄弱的钱包. 租房是很多人都离不开的硬性需求,这里就对从链家爬取的北京地区房屋出租数据进行一个简单分析 ...
- python爬取链家新房_Python爬虫实战:爬取链家网二手房数据
前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 买房装修,是每个人都要经历的重要事情之一.相对于新房交易市场来说,如今的二手房交易市场一点也 ...
- python 爬取链家成交房数据案例
爬取链家网流程为request.get得到网页信息,将得到的信息放入BeautifulSoup,再调用select爬取所需信息,用re正则表达式进行更细的筛选,用strip过滤无用字符串.具体代码如下 ...
最新文章
- MyBatis 3在XML文件中处理大于号小于号()的方法(转)
- C 语言回顾,数组指针的使用(小鸡肋的使用)
- 敏捷个人实践第16次活动:成为早起者
- python indices_python numpy triu_indices函数
- c语言中 快速输出字符数组后几位方法
- 经典算法-(六)老鼠走迷宫
- crossplaform---Nodejs in Visual Studio Code 04.Swig模版
- .net 4.5 新特性 async await 一般处理程序实例
- 人工免疫算法与物流中心选址问题
- oppok3如何刷机_OPPO K3刷机教程?
- 物种多样性学习 之Alpha多样性
- flutter基于provider状态管理设置主题颜色、实现简单登录、注册功能---页面+逻辑
- “ 作业帮 “ (Servlet)
- 导航栏 下拉菜单的制作
- 08运行程序常见错误
- 延时100ms的流水灯
- BM发声,孙宇晨入场,国产公链集体进军DeFi
- 基于vue的todolist案例
- 华为模拟器ENSP部分指令解释(计算机网络实验必备)
- Hi,你想要的在线创建架构图都在这儿!(四)
热门文章
- Sublime Text 2 - 性感无比的代码编辑器!程序员必备神器!
- 抖音关注对方显示服务器打瞌睡了,抖音关注了对方又取消了有显示吗
- 【信号处理专业必读:是复数但并不复杂的正交信号(万字长文)】
- 光子神经网络前沿—光子突触的STDP准则
- mybatis的标签以及参数传递
- C语言数组元素的左移、右移
- 君正X2000多核理器数据手册
- mu-bottom-navigation导航组件使用阿里巴巴字体图标的方法,vue使用Muse-UI引入阿里巴巴字体图标的方法
- 苹果计算机怎么返回上一步操作,iPhone12如何返回上一步 iPhone12返回上一步及关闭程序方法...
- 数字平原原画背后的解决方案