数据清洗

1.删除包含空字段的行

create view v_data_clean_null as
select * from `data` d where
job_href is not null and job_href != '' and
job_name is not null and job_name != '' and
company_href is not null and company_href != '' and
company_name is not null and company_name != '' and
providesalary_text is not null and providesalary_text != '' and
workarea is not null and workarea != '' and
workarea_text is not null and workarea_text != '' and
companytype_text is not null and companytype_text != '' and
degreefrom is not null and degreefrom != '' and
workyear is not null and workyear != '' and
updatedate is not null and updatedate != '' and
issuedate is not null and issuedate != '' and
parse2_job_detail is not null and parse2_job_detail != '';

2.按照企业和岗位进行去重保留最新一条

-- 去掉排序字段,把需要的字段都输入一遍
create view v_data_clean_distinct as
with p as
(select *,
row_number () over (partition by company_name,job_name order by issuedate) as row1
from v_data_clean_null )
select id,job_href,job_name,company_href,company_name,providesalary_text,workarea,workarea_text,updatedate,companytype_text,degreefrom,workyear,issuedate,parse2_job_detail
from p where row1=1;

3.筛选招聘地区在北上广深

-- 过滤招聘地区
create view v_data_clean_workplace as
select * from
(select *,
case when workarea_text like '%北京%' then '北京' when workarea_text like '%上海%' then '上海' when workarea_text like '%广州%' then '广州' when workarea_text like '%深圳%' then '深圳'
end as workplace
from v_data_clean_distinct ) a where a.workplace is not null;

4.过滤周边岗位保留任职要求包含数据的岗位

create view v_data_clean_jobname as
select * from v_data_clean_workplace vdcw where job_name like '%数据%';
-- 最终清洗结果
create view v_data_clean as
(select * from v_data_clean_jobname);

市场需求量

需求1:按照城市分组统计招聘总量和招聘职位数

create view v_data_market_demand as
select workplace as '城市',
sum(degreefrom) as '招聘总量',
count(*) as '职位数'
from v_data_clean group by workplace;

就业企业类型分布

需求2:按照企业类型进行招聘量的统计及招聘占比计算

create view v_data_companytype_degree as
select companytype_text as '企业类型',
companytype_degreefrom as '招聘总量',
concat(cast(companytype_degreefrom /sum_degreefrom*100 as decimal(4,2)),'%') as '招聘占比'
from
(select companytype_text ,
sum(degreefrom) as companytype_degreefrom
from v_data_clean group by companytype_text) f1,
(select sum(degreefrom) as sum_degreefrom from v_data_clean) f2
order by companytype_degreefrom desc;

岗位薪资

需求3:计算岗位薪资的单位,最大,最小值,均值

create view v_data_salary_min_max_mean as
with p as
(select * ,
cast(
(case when unit=10000 then substring_index(substring_index(providesalary_text,'万/月',1),'-',1)when unit=1000 then substring_index(substring_index(providesalary_text,'千/月',1),'-',1)when unit=833 then substring_index(substring_index(providesalary_text,'万/年',1),'-',1)
end ) as decimal(10,2))*unit as salary_min,
cast(
(case when unit=10000 then substring_index(substring_index(providesalary_text,'万/月',1),'-',-1)when unit=1000 then substring_index(substring_index(providesalary_text,'千/月',1),'-',-1)when unit=833 then substring_index(substring_index(providesalary_text,'万/年',1),'-',-1)
end ) as decimal(10,2))*unit as salary_max
from v_data_salary_unit)
select *,cast((salary_min+salary_max)/2 as decimal(10,2)) as salary_mean from p;

需求4:按照工作年限分组,计算各组平均薪资

create view v_data_workyear_salary as
select workyear as '工作年限',
avg(salary_mean) as '平均薪资'
from v_data_salary_min_max_mean
group by workyear
order by length(workyear),workyear ;

需求5:按照企业类型分组,计算各组平均薪资

create view v_data_companytype_salary as
select companytype_text  as '企业类型',
avg(salary_mean) as '平均薪资'
from v_data_salary_min_max_mean
group by companytype_text
order by avg(salary_mean) desc ;

岗位核心技能

需求6:查询技能点在招聘任职要求中出现的次数及前30

create view v_data_skill_quantity as
select st.skill ,
count(*) as quantity
from v_data_clean v
inner join skill_table st on v.parse2_job_detail like concat('%',st.skill,'%')
group by st.skill
order by quantity desc limit 30;

需求7:计算各个技能点出现的频率

create view v_data_skill as
select skill as '技能点',
quantity as '出现频数',
concat(cast(quantity/total_quantity*100 as decimal(10,2)),'%') as '出现频率'
from v_data_skill_quantity ,(select count(*) as total_quantity from v_data_clean ) as f;

总结

1.上海对于数据分析师需求最大

2.数据分析师在工作第5年薪资即可翻倍

3.民营企业对数据分析师需求最大

4.SQL,大数据,EXCEL,报告撰写等是数据分析岗位中普遍的要求

SQL 招聘网站岗位数据分析相关推荐

  1. 招聘网站—Hive数据分析

    招聘网站-Hive数据分析 第1关:统计最热门的十种职业(招聘人数最多) #进入hive hive #在hive中创建数据库 mydb create database mydb; #使用数据库 myd ...

  2. 招聘网站岗位职位标签大全(爬虫所用)

    JOB_TYBE = ['', '采煤掘进', '外观结构设计', '轧钢', '岩土工程师', '游戏开发', '医导', '窑炉工程师', '机械', '机电设备', '房地产开发', '农业水利 ...

  3. Python爬虫+可视化分析技术实现招聘网站岗位数据抓取与分析推荐系统

    程序主要采用Python 爬虫+flask框架+html+javascript实现岗位推荐分析可视化系统,实现工作岗位的实时发现,推荐检索,快速更新以及工作类型的区域分布效果,关键词占比分析等. 程序 ...

  4. 数据分析毕业设计 招聘网站大数据分析与可视化系统 - python flask

    文章目录 0 前言 1 课题背景 2 实现效果 3 Flask框架 4 Echarts 5 爬虫 0 前言

  5. (附源码)node.js华联招聘网站011229

    华联招聘网站 摘 要 随着科学技术的飞速发展,社会的方方面面.各行各业都在努力与现代的先进技术接轨,通过科技手段来提高自身的优势,招聘网站当然也不能排除在外.招聘网站是以实际运用为开发背景,运用软件工 ...

  6. (附源码)node.js华联招聘网站 毕业设计 011229

    华联招聘网站 摘 要 随着科学技术的飞速发展,社会的方方面面.各行各业都在努力与现代的先进技术接轨,通过科技手段来提高自身的优势,招聘网站当然也不能排除在外.招聘网站是以实际运用为开发背景,运用软件工 ...

  7. springbooy+求职招聘网站 毕业设计-附源码301914

    基于springboot的求职招聘网站 摘  要 随着科学技术的飞速发展,社会的方方面面.各行各业都在努力与现代的先进技术接轨,通过科技手段来提高自身的优势,求职招聘网站当然也不能排除在外.求职招聘网 ...

  8. (附源码)php企业招聘网站 毕业设计222219

    企业招聘网站 摘要 随着科学技术的飞速发展,社会的方方面面.各行各业都在努力与现代的先进技术接轨,通过科技手段来提高自身的优势,企业招聘网站当然也不能排除在外.企业招聘网站是以实际运用为开发背景,运用 ...

  9. php企业招聘网站 毕业设计-附源码222219

    企业招聘网站 摘 要 随着科学技术的飞速发展,社会的方方面面.各行各业都在努力与现代的先进技术接轨,通过科技手段来提高自身的优势,企业招聘网站当然也不能排除在外.企业招聘网站是以实际运用为开发背景,运 ...

最新文章

  1. puppet 类、模块
  2. seci-log1.02日志分析软件版本升级了
  3. 鲨鱼 抓包 oracle,ubuntu下网络抓包工具wireshark tcpdump的使用
  4. 11个笑话让你领悟人生
  5. 在linux上实现DllMain + 共享库创建方法
  6. Linux:守护进程解析、如何实现守护进程
  7. 小米9稳定版系统更新:加入水滴屏形状切换开关
  8. oracle数据库cp命令,Oracle数据库备份与恢复(I)
  9. html登陆滑动验证,js实现登录时的滑动验证【原创】
  10. 心跳包、乒乓包、SO_KEEPLIVE
  11. 华为研发机试题目集合整理
  12. MySQL中表的增删查改操作(CRUD)
  13. 考研数学公式默写记忆PDF
  14. 学习《软件工程》心得
  15. 余秋雨大师描写我的家乡
  16. (读论文)启体书法字的矢量化-曹芳
  17. php如何连接数据库 甲骨文,Windows PHP/phpStudy 连接 甲骨文Oracle 数据库 oci8 – 让我们荡起双桨的博客 – CSDN博客...
  18. 【本科生科研入门】如何整理个人大学生涯的成果?
  19. 小试牛刀—猜数字游戏
  20. 英语学习-that和which区别

热门文章

  1. day24/MyIE.java
  2. 空间平面的旋转与位移
  3. Ubuntu16.04 安装VM12:解决网卡驱动vmnet安装失败的问题
  4. msfconsole之制作windows木马并成功获取shell
  5. CentOS重启后resolv.conf被重置的解决方案
  6. 翻译小程序源码1.2最新版
  7. php获取python运行结果_“如何实现在PHP中调用Python并获取运行结果“
  8. C语言字符数组的输入输出处理
  9. [转帖]惠普笔记本Win7激活方法
  10. 学计算机的女生就业方向知乎,知乎高赞回答:什么样的人适合学计算机?