项目背景:男女人数差过大,导致大部分适合结婚的男女没有找到心仪的另一半,可以选择通过各种相亲网站,但网站上面的信息过多而且需要会员才能获取到联系方式,因此我们项目主要是通过爬取相亲网站(在此采用我主良缘相亲网站)信息,根据所想条件进行筛选,寻找到契合灵魂的人。

步骤如下:

1.使用软件python 3.7 :软件安装教程就不在此详细讲解,详情信息可以通过python官网进行了解

2.安装相关的python库:pip install 库名

提示信息出现successful就表示成功安装,出现worning不用在意,只是提醒。

import requests
import os
import json
import openpyxl  #操作excel

3.对年龄进行筛选(采用if-elif-else)

def set_age():age = int(input('请输入期望对方的年龄(如:24):'))if 20<= age <=90:#年龄段范围选择if 21 <= age <= 30:startage = 21#起始年龄21endage = 30#截止年龄30elif  31<= age <= 40:startage = 31endage = 40elif  41<= age <= 50:startage = 41endage = 50elif  51<= age <= 60:startage = 51endage = 60elif  61<= age <= 70:startage = 61endage = 70elif  71<= age <= 80:startage = 71endage = 80elif  81<= age <= 90:startage = 81endage = 90else:startage = 0endage = 0else:print("不存在")return startage,endage

4.对性别进行筛选(为防止意料之外的情况出现,在外面加入了一个大的范围条件进行控制)

def set_sex():sex = input("请输入期望对方性别(如:女):")if sex =='男' or sex== '女':if sex == '男':gender =1else:gender=2else:print("请核对性别是否正确")return gender

5.为了能够筛选出更加符合条件的人,限制条件为4个,另外两个也采用if-elif-else判断筛选

# 身高
def set_height():height =input("请输入期望对方的身高(如:162):")if 151<= int(height) <=190:if 151 <= int(height) <= 160:startheight = 151endheight = 160elif 161 <= int(height) <= 170:startheight = 161endheight = 170elif 171 <= int(height) <= 180:startheight = 171endheight = 180elif 181 <= int(height) <= 190:startheight = 181endheight = 190else:startheight = 0endheight = 0else:print("不存在")return startheight,endheight#工资
def set_money():money = int(input("请输入期望的对方月薪(如5000):"))if 1000 <= money <5000:salary = 2elif 5000 <= money < 10000:salary = 3elif 10000 <= money < 20000:salary = 4   elif 20000 <= money :salary = 5else:salary = 0return salary

6.在对条件进行筛选后,就可以着手准备开始解析网页,将解析网页中的数据用txt保存。

def get_data(page,startage,endage,gender,startheight,endheight,salary):#解析网页#字符串的格式化#伪装浏览器的信息##a={'User-Agent':'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.55 Mobile Safari/537.36 Edg/96.0.1054.41'}url = 'https://m.7799520.com/api/recommend/wap/search/list/search?startage={}&endage={}&gender={}&startheight={}&endheight={}&marry=1&salary={}&page={}'.format(startage,endage,gender,startheight,endheight,salary,page)res=requests.get(url)#状态码 200 请求成功if res.status_code ==200:return res.json()return res.text

7.关于信息保存,在此进行基本数据以及照片保存,基础数据可以通过代码,在同一路径下自动生成一个excel表格,照片保存需要自己在.py文件的路径下手动添加image文件夹进行图片保存。

爬虫爬取相亲网站信息相关推荐

  1. python爬虫招聘-Python爬虫-爬取招聘网站信息(一)

    学习内容,来源于百度搜索 工具及环境 1.python版本:python 3.7.3 2.安装工具:beautifulsoup 3.系统环境:Windows10 4.浏览器:chrome 网页分析 i ...

  2. 爬虫爬取二次元网站美女图片

    爬虫爬取二次元网站美女图片 前言 xpath解析 需求分析 代码编写 总代码 前言 本次需要爬取二次元网站cos板块下的图片 需要用到request模块与lxml模块,所以请提前安装好这两个模块,打开 ...

  3. Python POST 爬虫爬取掘金用户信息

    Python POST 爬虫爬取掘金用户信息 1. 概述 Python第三方库requests提供了两种访问http网页的函数,基于GET方式的get()函数和基于POST方式的post()函数. g ...

  4. 深圳python爬虫培训南山科技园钽电容回收_记一次python 爬虫爬取深圳租房信息的过程及遇到的问题...

    为了分析深圳市所有长租.短租公寓的信息,爬取了某租房公寓网站上深圳区域所有在租公寓信息,以下记录了爬取过程以及爬取过程中遇到的问题: 爬取代码: import requests from reques ...

  5. python解决租房问题_记一次python 爬虫爬取深圳租房信息的过程及遇到的问题

    为了分析深圳市所有长租.短租公寓的信息,爬取了某租房公寓网站上深圳区域所有在租公寓信息,以下记录了爬取过程以及爬取过程中遇到的问题: 爬取代码: import requests from reques ...

  6. python网络爬虫_Python网络爬虫——爬取视频网站源视频!

    原标题:Python网络爬虫--爬取视频网站源视频! 学习前提 1.了解python基础语法 2.了解re.selenium.BeautifulSoup.os.requests等python第三方库 ...

  7. java爬虫拉勾网_[Java教程]node.js爬虫爬取拉勾网职位信息

    [Java教程]node.js爬虫爬取拉勾网职位信息 0 2017-03-14 00:00:21 简介 用node.js写了一个简单的小爬虫,用来爬取拉勾网上的招聘信息,共爬取了北京.上海.广州.深圳 ...

  8. python怎么爬网站视频教程_python爬虫爬取某网站视频的示例代码

    把获取到的下载视频的url存放在数组中(也可写入文件中),通过调用迅雷接口,进行自动下载.(请先下载迅雷,并在其设置中心的下载管理中设置为一键下载) 实现代码如下: from bs4 import B ...

  9. 爬虫实战:过年你被催婚啦吗?爬取相亲网站,看看当下年轻小姐姐的择偶观。

    前言 到了一定年龄,父母可能会催你找女朋友,结婚. 大多数的父母催婚,是父母渐渐老了,想让你找个人照顾你,有热饭吃,生病了有人照顾.在外面不被人欺负. 当然,也有一部分来自周围人的压力,跟你同龄的孩子 ...

最新文章

  1. 推荐7款超良心的windows软件,每一个都是精品!
  2. AS3.0中is,as运算符
  3. python数组的切片操作_对Python 数组的切片操作
  4. Riot - 比 Facebook React 更轻量的 UI 库
  5. java excel api及详细教程_针对Java Excel API及详细教程
  6. global.asax不执行原因
  7. ffmpeg 编码如何做带宽控制输出
  8. 计算机知识点数制的概念,计算机等级考试,数制的基本概念知识点
  9. oracle 10g 各版本下载地址
  10. Python爬虫进阶教程:抖音APP无水印视频批量下载
  11. outlook导入服务器邮件,OUTLOOK怎么导入邮件?
  12. Little Dima and Equation
  13. ArcGIS打开影像图显示全黑色解决办法
  14. 搞数仓也得懂几个常用机器学习算法
  15. 安卓逆向工程--针对授权key方式的破解
  16. OpenNI2的安装教程
  17. 欢迎访问互联网进化论官方网站
  18. 怎样查看hp台式计算机名称,惠普台式机型号怎么样查看
  19. 论文阅读:A Taxonomy and Evaluation of Dense Light Field Depth Estimation Algorithms
  20. antd的Modal

热门文章

  1. windows server 2012 r2 standard 通过堡垒机远程桌面服务器报错Remote Desktop Service CALs Request Failed
  2. NVIDA驱动安装-Ubuntu22.04
  3. 为什么技术圈都在盛传《纳瓦尔宝典》?
  4. Gartner评估:众包将掀起IT服务市场的革命
  5. 2019年考研数学一真题pdf ​​​
  6. 2022最新拼多多anti_content加密算法
  7. CentOS系统克隆多台机器,有时桥接模式下多台机器IP相同
  8. adb 获取蓝牙 mac地址 、wifi mac地址的方法
  9. word嵌入对象依损坏_这8个Word常见问题,明明1分钟就能搞定,你却每次折腾大半天!...
  10. app Store 审核被拒问题详解