python爬虫课程设计摘要_爬虫课程设计(爬虫代码)
import bs4
from selenium import webdriver
import time
import pymysql
import csv
def getWebDriver(url):
# 进入浏览器设置
options = webdriver.ChromeOptions()
# 设置中文
options.add_argument('lang=zh_CN.UTF-8')
# 更换头部
options.add_argument(
'user-agent="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.130 Safari/537.36"')
# 创建浏览器对象
wd = webdriver.Chrome(chrome_options=options)
wd.implicitly_wait(100)
wd.maximize_window()
wd.get(url)
return wd
def getjoplist(wd):
list=[]
text = wd.find_element_by_class_name("j_joblist").get_attribute("outerHTML")
soup = bs4.BeautifulSoup(text,"html.parser")
joblist = soup.find_all("div",class_="e")
# 南京 | 3-4年经验 | 本科 | 招1人
for i in joblist:
jobname = i.find("a").find("p",class_="t").find_all("span")[0].attrs["title"]
jobsalary=i.find("a").find("p",class_="info").find_all("span")[0].text
if (len(jobsalary)==0):
jobsalary="null"
Jobcity=i.find("a").find("p",class_="info").find_all("span")[1].text
jobcity=str(Jobcity).split("|")[0].replace(" ","")
jobneed=str(Jobcity)[len(jobcity)+2:-1].replace(" ","")
companyclassify = str(i.find("div",class_="er").find("p",class_="dc at").text).replace(" ","")
if (len(companyclassify)==0):
companyclassify="null"
companyclassify2= str(i.find("div",class_="er").find("p",class_="int at").text).replace(" ","")
if (len(companyclassify2)==0):
companyclassify2="null"
list.append([jobname,jobsalary,jobcity,jobneed,companyclassify,companyclassify2])
return list
def changePage(wd):
# next = wd.find_element_by_css_selector('li[class="next"]')
next = wd.find_element_by_css_selector('div[class="j_page"]')
next = next.find_element_by_css_selector('li[class="next"]')
next.click()
url = "https://search.51job.com/list/000000,000000,0000,00,9,99,+,2,1.html?lang=c&postchannel=0000&workyear=99&cotype=99°reefrom=99&jobterm=99&companysize=99&ord_field=0&dibiaoid=0&line=&welfare="
wd = getWebDriver(url)
#
file_path="d:/dst/爬虫课程设计3.csv"
csv_file= open(file_path, 'w', newline='', encoding='utf-8')
writer = csv.writer(csv_file)
list1=[]
for j in range(2000):
print(j)
list = getjoplist(wd)
# time.sleep(0.5)
for i in list:
writer.writerow(i)
print(i)
try:
changePage(wd)
except:
try:
changePage(wd)
except:
changePage(wd)
# list = getjoplist(wd)
#
# for i in list:
# writer.writerow(i)
# print(i)
#
# time.sleep(0.5)
csv_file.close()
原文链接:https://blog.csdn.net/GXYMOON_/article/details/112481864
python爬虫课程设计摘要_爬虫课程设计(爬虫代码)相关推荐
- HTML5期末大作业:甜品店网站设计——美食甜品店铺加盟企业(1页) HTML+CSS+JavaScript web期末作业设计网页_美食网页设计作业成品
HTML5期末大作业:甜品店网站设计--美食甜品店铺加盟企业(1页) HTML+CSS+JavaScript web期末作业设计网页_美食网页设计作业成品 常见网页设计作业题材有 个人. 美食. 公司 ...
- python基于svm项目+课程设计报告_单片机课程设计教学模式研究
单片机课程设计教学模式研究 摘要:在分析单片机课程设计现状的基础上,提出将先进的CDIO工程教育理念应用到单片机课程设计教学中,对课程设计的时间安排.选题.组织实施.考核等方面进行改革与创新,构建新的 ...
- python精品课程申报书_精品课程申报书
课程介绍(教学内容的实用性,运用现代信息技术情况,课程及教学改革情况,理论教学与实践教学结合情况,课程特色,教学效果等) <健康评估>是护士运用护理基本理论.基本知识.基本技能对个体.家庭 ...
- 用python写排课系统_大学课程的有效排课
我目前正在一个网站上工作,该网站将允许我所在大学的学生根据他们想修的课程自动生成有效的课程表. 在网站上工作之前,我决定解决如何有效地安排课程的问题. 一些澄清:我们大学的每门课程 大学)由一个或多个 ...
- 幼儿园课程体系结构图_幼儿园课程精编版
最新资料推荐 1 幼儿园课程 第一节 幼儿园课程概述 一.幼儿园课程的内涵: 目前我国幼儿园课程主导的定义是活动论. 幼儿园课程是实现幼儿园教育目的的手段, 是帮助幼儿获得有益的学习经验, 促进身心全 ...
- ui设计入门书籍_书籍封面设计入门指南
坦白说,我们大多数时候都根据本书的封面来判断一本书(并且有许多博客专门讨论消遣). 具有良好图形 ,醒目的字体和高质量封面的 书籍 比没有 书籍的书籍 出售更多的副本 –这是事实. 尽管有人说,书的封 ...
- 精美网页设计案例_用户体验设计的精美艺术
精美网页设计案例 There are interactive experiences that simply blow you away. You know it's been a positive ...
- 背包系统 设计要点_建立新设计系统的要点和要点
背包系统 设计要点 重点 (Top highlight) When I first sat down with my company's CEO and CRO to pitch them on a ...
- 工业设计中一般运用计算机,计算机辅助工业设计知识点_计算机辅助工业设计中的人机交互...
摘要:随着科技的发展,工业设计行业也在不断发展,而与此同时,工业市场对工业设计中的产品的品种多样化.趣味化的要求也变得越发的严格.为了确保工业设计在质量和数量上能够更好的发展,计算机辅助工业设计中的建 ...
- 优秀logo设计解析_优秀Logo设计!字母造型解析
文/高胜楠 孙婷 字母造型有其独特的审美价值和艺术趣味,字母或字母组合的变化可产生多种多样的标志形式,字母已成为应用最广的种标志表现形式之一. 字母具有几何化的造型特征与形态变化多样的优势,字母标志的 ...
最新文章
- python3 内置函数map 返回的迭代器转为列表
- 有的人在25岁时就死了,但在75岁时才被埋葬:周鸿祎
- Linux scp -r命令主机间文件复制
- 邮件服务器在企业网中的应用
- 功率谱 幅值谱_语音合成中的Mel谱和MFCC谱无区别
- caffe学习日记--lesson6: 常用的caffemodel下载链接
- 计算机软考网络工程师,软考之网络工程师总结
- HDU 1880 魔咒词典
- 什么是脚本语言(python脚本是什么?)
- table表格锁定任意数量列或行
- 大学计算机英语要求,2015级本科生大学英语、计算机分级考试要求.doc
- 笔记本计算机卡,笔记本电脑越来越卡怎么办 不同原因解决方法不同
- 在tensorflow2.0环境下使用RandLA-Net训练S3DIS数据集
- GAMES101-现代计算机图形学入门-闫令琪 - lecture15 光线追踪3 - 辐射度量学、渲染方程(Ray Tracing 3) - 课后笔记
- 【养生】【作息】作息+十二时辰养生
- 重装系统 重启计算机失败,电脑重装系统失败,不能开机了,怎么办,急求解决办法啊...
- char、nchar、varchar、nvarchar的区别和特点
- IT行业能干到多少岁?
- rac建oracle表空间,Oracle Rac创建表空间及用户
- DAY6:利用 PHP 编写登陆页面
热门文章
- axios重新调用失败的ajax_Vue之axios实现ajax数据请求
- python定义模块结束语_python-模块定义、导入、优化
- 递归求解全排列问题以及八皇后问题
- pytorch学习笔记(二十):Padding-And-Strides
- 用python进行数据分析——第十二章.高阶pandas
- Java 1.1.7 String API (!!!)
- ubuntu 16.04 官网版安装 caffe 步骤详解[CPU][紧跟官网,永不踩坑]
- EC600S-CN CAT1通信模组,2G退网升级4G如何选择,QuecPython开发资源下载
- Linux下压缩、解压缩、效率,linux tar bz、bz2、gz、zip
- 搭建本地ubuntu镜像服务器(arm版)