死亡公司公墓数据(IT桔子)
最近很火的死亡公司公墓
有些公司虽然已经死了,但是依然活在我们心中,比如上香第一的(斜眼笑)
今天带大家用selenium获取死亡公司数据
代码如下
drive = webdriver.Chrome()
url='https://www.itjuzi.com/deathCompany'
drive.get(url)
result=[]
count=1
next_page=drive.find_element_by_xpath('//*[@id="app"]/div[1]/div/div/div/div[2]/div/div[3]/div[2]/div/div/button[2]')#下一页
while next_page.is_enabled():#判断下一页是否可用links = drive.find_element_by_tag_name("tbody").find_elements_by_tag_name("tr")#获取当前页面公司数量num=len(links)for i in range(1,num+1):gsjc=drive.find_element_by_xpath('//tbody/tr[%s]/td[3]/div/h5/a'%i).text#获取公司简称ch_time=drive.find_element_by_xpath('//tbody/tr[%s]/td[3]/div/p'%i).text#获取存活时间close_time=drive.find_element_by_xpath('//tbody/tr[%s]/td[4]'%i).text#获取关闭时间hy=drive.find_element_by_xpath('//tbody/tr[%s]/td[5]'%i).text#获取所属行业dd=drive.find_element_by_xpath('//tbody/tr[%s]/td[6]'%i).text#获取公司地点clsj=drive.find_element_by_xpath('//tbody/tr[%s]/td[7]'%i).text#获取关闭时间rz=drive.find_element_by_xpath('//tbody/tr[%s]/td[8]'%i).text#获取融资状态result.append([gsjc,ch_time,close_time,hy,dd,clsj,rz])#添加到嵌套列表print("第 %s 页爬取完成"%count)drive.find_element_by_xpath('//*[@id="app"]/div[1]/div/div/div/div[2]/div/div[3]/div[2]/div/div/button[2]').click()#点击下一页tm=random.uniform(2,5)#生成随机数time.sleep(tm)#随机休眠count+=1#页数+1
pd_result=pd.DataFrame(result)
pd_result.columns=['公司简称','存活时间','关闭时间','行业','地点','成立时间','获投状态']
pd_result.to_excel("IT桔子死亡公墓.xlsx",index=False)
死亡公司公墓数据(IT桔子)相关推荐
- Python 爬取 6271 家死亡公司数据,一眼看尽十年创业公司消亡史!
作者 | 朱小五 责编 | 刘静 前段时间老罗和王校长都成为自己的创业公司成了失信人,小五打算上IT桔子看看他们的公司. 意外发现IT桔子出了个死亡公司库(https://www.itjuzi.com ...
- Python爬取6271家死亡公司数据,一眼看尽十年创业公司消亡史!
作者:朱小五 来源:凹凸玩数据 在开始正文前,首先介绍下首届"森麟杯"数据分析大赛,详情可以戳:参与首届"森麟杯"数据分析竞赛,分享千元红包 前段时间老罗和王校 ...
- 爬取6271家死亡公司数据,看十年创业公司消亡史
戳蓝字"CSDN云计算"关注我们哦! 作者 | 朱小五 责编 | 阿秃 前段时间老罗和王校长都成为自己的创业公司成了失信人,小五打算上IT桔子看看他们的公司. 意外发现IT桔子出了 ...
- 又一起“删库”:链家程序员怒删公司 9TB 数据,被判 7 年
整理 | 王晓曼 来源 | CSDN(ID:CSDNnews) 1月6日,北京市第一中级人民法院公布前链家员工破坏计算机信息系统罪一案的刑事裁定书,被告人因不满工作调整,删公司9TB数据. 北京市海淀 ...
- 菲律宾达沃照明和电力公司的数据中心发生火灾
日前据悉,位于菲律宾棉兰老岛的电力机构达沃照明电力公司的数据中心发生火灾,而当地一家出版社Inquirer.net的办公室位于电力公司附近. 这场大火发生在1月7日上午9点,相关机构接到报警之后进行处 ...
- 初创公司怎么做销售数据分析_初创公司与Faang公司的数据科学
初创公司怎么做销售数据分析 介绍 (Introduction) In an increasingly technological world, data scientist and analyst r ...
- pandas自动化实战小任务1--对excel表格分 供应商 付款年月 进行汇总(涉及根据即有相同也有不同的index的表格合并)公司的数据
说明: 由于是公司的数据,所以对供应商进行映射处理, 数据下载连接(免费):数据下载 导包 import numpy as np import pandas as pdfrom datetime im ...
- 新库上线 | CnOpenDataA股上市公司财务报表数据
A股上市公司财务报表数据 一.数据简介 据<上市公司信息披露管理办法>,上市公司作为信息披露义务人,应真实.准确.及时.完整地向市场公开依法及自愿披露的信息.这些公开披露的信息包含但不仅限 ...
- 大数据24小时:系统工程领域专家夏耘出任海云数据CEO,交通部将对网约车公司运营数据进行监管
[数据猿导读]系统工程领域专家夏耘加盟海云数据,接替冯一村任CEO一职:交通部颁布<办法>,将对网约车公司运营数据进行监管:阿里云在欧洲推出多款产品,涉及大数据.人工智能.安全等领域--以 ...
最新文章
- C++ algorithm的sort函数总结
- 华中科技大学计算机考研408,【21计算机考研】华中科技大学不改408了?燕山大学官宣408!...
- openface 和openpose(pytorch)剪枝之路
- Skype for Business Server 2015-03-后端服务器-1-安装
- Netty入门教程——初识Netty
- 图像梯度-Sobel算子
- 计算机软考网络工程师中级多少分过,2019年计算机软考网络工程师中级及格分数...
- c++教你唱响天空之城(源码奉上)
- 路由器网口1一直闪烁正常吗_路由器灯怎么闪才正常
- 通信类顶级会议及期刊
- webrtc 入门第一章 基本设备操作
- java mavlink_java – 使用消息更改速度到Mavlink
- 现代计算机之父—冯·诺依曼
- COOX培训材料 — PMT(4.Procedure)
- 计算机如何安装cpu风扇,cpu风扇安装,小编教你cpu风扇怎么安装
- 最大熵阈值python_【6】python-opencv3教程:阈值分割(全阈值分割,局部阈值分割,直方图技术法,熵算法,自适应算法,Otsu算法)...
- 有关Linux内核版本命名规则
- eclipse设置中文
- 关于MIUI刷入谷歌GAPPS后卡FC的问题
- 如何通过刷百度指数来提高网站的权重
热门文章
- Beta阶段基于NABCD评论作品
- 【ZZULIOJ】1088: 手机短号 (多实例)
- 1088: 手机短号 (多实例)C语言
- 给出x.509证书的实例并分析其工作方式
- cocos《破碎骑士》开发日志
- ARTIX-7 XC7A35T实验项目之流水灯
- android 服务端技术,移动应用服务器端开发(基于JSP技术)-2017 Android系统构架 Android系统构架.docx...
- 【Spring之轨迹】结合 @Scheduled 实现定时将 Redis 缓存刷入数据库(配 Redis 工具类与例子实战)
- wps表格里某一行或某一列怎么加上相同的数字、字母或者汉字
- 一口气推荐16个让人震惊的黑科技工具