最近 创造营2020好多小姐姐吸引到我了,于是就有这这个

颜值100分的小姐姐高达21位比如前段时间抖音很火的 凡凡

以下是代码,需要你在申请腾讯云有关参数替换哦

# -*- coding: utf-8 -*-
"""
Created on Sun May 24 20:45:13 2020@author: Gdc
"""import requests
from fake_useragent import UserAgent
import pandas as pd
import json
from lxml import etreefrom tencentcloud.common import credential
from tencentcloud.common.profile.client_profile import ClientProfile
from tencentcloud.common.profile.http_profile import HttpProfile
from tencentcloud.common.exception.tencent_cloud_sdk_exception import TencentCloudSDKException
from tencentcloud.iai.v20180301 import iai_client, models #腾讯云人脸检测与分析
#检测给定图片中的人脸(Face)的位置、相应的面部属性和人脸质量信息
#位置包括 (x,y,w,h)
#面部属性包括性别(gender)、年龄(age)、表情(expression)、魅力(beauty)、眼镜(glass)、发型(hair)、口罩(mask)和姿态 (pitch,roll,yaw)
#人脸质量信息包括整体质量分(score)、模糊分(sharpness)、光照分(brightness)和五官遮挡分(completeness)def faceScore(url):try: cred = credential.Credential("你的key", "你的id") httpProfile = HttpProfile()httpProfile.endpoint = "iai.tencentcloudapi.com"clientProfile = ClientProfile()clientProfile.httpProfile = httpProfileclient = iai_client.IaiClient(cred, "ap-beijing", clientProfile) req = models.DetectFaceRequest()param = {"Url":url,"NeedFaceAttributes":1}params = json.dumps(param)req.from_json_string(params)resp = client.DetectFace(req) respstr = resp.to_json_string().replace('false','0').replace('true','1')respdic = eval(respstr)age = respdic['FaceInfos'][0]['FaceAttributesInfo']['Age']beauty = respdic['FaceInfos'][0]['FaceAttributesInfo']['Beauty']except TencentCloudSDKException as err: print(err)return age,beautyurl = 'https://zbaccess.video.qq.com/fcgi/getVoteActityRankList?'headers = {"User-Agent": UserAgent(verify_ssl=False).random}params = {'raw': 1,'vappid': 51902973,'vsecret': '14816bd3d3bb7c03d6fd123b47541a77d0c7ff859fb85f21','actityId': 107015,'pageSize': 101,'vplatform': 3,'listFlag': 0,'pageContext':'' ,'ver': 1,'_t': 1590324974706,'_': 1590324974708}
re = requests.get(url,headers = headers,params = params)data = json.loads(re.text)Li_list = data['data']['itemList']
rank = 0
data_list = []#获取每个选手的基础信息
for li in Li_list:rank += 1item = {}#获取基础信息item['当前排名'] = rankitem['选手编号'] = li['itemInfo']['id']item['选手姓名'] = li['itemInfo']['name']item['选手照片'] = li['itemInfo']['mapData']['poster_pic']item['选手状态'] = li['statusInfo']['voteBtnTxt']#获取选手doki页#根据选手编号id到选手doki页面获取粉丝数、星座、身高、生日等基础个人信息#简单的静态页面,这里用到xpath做解析id_ = item['选手编号']url_ = f'https://v.qq.com/x/star/{id_}?tabid=2're_ = requests.get(url_,headers = headers)re_.encoding='utf-8'html = etree.HTML(re_.text)item['粉丝数'] = html.xpath('.//div[@class="followers_count"]/text()')[0]info = html.xpath('.//div[@class="wiki_info_1"]//span[@class="content"]/text()')item['星座'] = info[-5]item['身高'] = info[-3]item['体重'] = info[-2]item['出生地'] = info[-1]info2 = html.xpath('.//div[@class="wiki_info_2"]//span[@class="content"]/text()')item['生日'] = info2[0]url_ai = item['选手照片']age,beauty = faceScore(url_ai) item['AI预测年龄'] = ageitem['AI颜值评分'] = beautydata_list.append(item)df = pd.DataFrame(data_list)
df.to_excel(r'D:\python\创造营\创造营2020名单.xlsx',sheet_name='名单',index=0)

源码分享在文章里了   你觉得哪个小姐姐最好看呢?项目文件加下群:1136192749

Python爬取《创造营2020》小姐姐数据用腾讯云人脸识别做颜值评分相关推荐

  1. Python爬取《创造营2020》小姐姐数据并用腾讯云人脸识别做颜值评分

    最近 创造营2020好多小姐姐吸引到我了,于是就有这这个 颜值100分的小姐姐高达21位 比如前段时间抖音很火的 凡凡 以下是代码,需要你在申请腾讯云有关参数替换哦 # -*- coding: utf ...

  2. 实践应用|快来pick你喜欢的小姐姐吧,Python爬取青春有你2和创造营2020小姐姐数据

    文章目录 先看结果 ①创造营2020撑腰榜前三甲 ②青春有你2当前官方榜前三甲 ③Face++男女视角颜值最高 女性视角颜值第一名 男性视角颜值第一名 ④小姐姐们籍贯分布(pyecharts作图) 创 ...

  3. Python爬取不羞涩网小姐姐图片——BeautifulSoup应用

    引言 今年提倡原地过年,相信很多朋友都没有回家过年,像我就被迫留在深圳过年了,无聊之余只能去看看电影爬爬山.今天给大家带来一个打发无聊时光的案例,用Python爬取不羞涩网小姐姐图片,并保存到本地,老 ...

  4. 三分钟教会你用Python爬取到喜欢的小姐姐图片

    使用Python爬取小姐姐图片 首先上网站链接 唯vb.net教程 美女生 爬取图片主要分为一下几步: 1.打开一个你喜欢c#教程的小姐姐的网站 E.g xiaojiejie web 2.下载并安装p ...

  5. python爬取网易云音乐薛之谦歌词数据,生成词云

    老薛最近频频上热搜,因为老薛的歌大部分是自己作词,所以感觉他的歌词和他应该有某种情感表达和联系吧. 于是用python爬了网易云音乐中老薛的歌词数据,并简单用wordcloud写了个词云统计. 难过, ...

  6. Python爬虫:运用多线程、IP代理模块爬取百度图片上小姐姐的图片

    Python爬虫:运用多线程.IP代理模块爬取百度图片上小姐姐的图片 1.爬取输入类型的图片数量(用于给用户提示) 使用过百度图片的读者会发现,在搜索栏上输入关键词之后,会显示出搜索的结果,小编想大多 ...

  7. 利用python爬取丁香医生上新型肺炎数据,并下载到本地,附带经纬度信息

    新增:国外疫情网站介绍 已更新:爬取国外疫情数据 已更新:新型肺炎历史数据下载 2020年3月27日补充: 制作了一个全球肺炎数据查询下载网站,效果如下: 访问地址:http://119.3.227. ...

  8. Python爬取王者荣耀英雄的皮肤数据并下载皮肤图片项目

    Python爬取王者荣耀英雄的皮肤数据,并下载皮肤图片!高清的图片用来做桌面也不错哟~ 网址:https://pvp.qq.com/web201605/herolist.shtml 1.获得英雄信息, ...

  9. python爬取电脑本地数据_利用python爬取丁香医生上新型肺炎数据,并下载到本地,附带经纬度信息...

    原标题:利用python爬取丁香医生上新型肺炎数据,并下载到本地,附带经纬度信息 新型肺炎肆虐全国,可以预知,最近一两年地理学中会有一部分论文研究新型肺炎的空间分布及与其他指标的关联分析.获取其患病人 ...

最新文章

  1. gitflow分支管理模型
  2. oracle网站注入,oracle注入,utl_http方法
  3. 「翻译」SAP MM 供应商评估流程初阶
  4. 【Flutter学习】组件学习之目录
  5. 联想打印机7256显示更换墨盒_惠普打印机涉嫌垄断?只认自家“昂贵”墨盒,成本太高招架不住...
  6. 测试计划与测试方案的区别
  7. mysql触发器不能alter
  8. 数据结构笔记(三十)-- 查找的基本概念和相关的顺序查找
  9. 查询软件和硬件列表清单[将文章里代码另存为 list.vbs,双击运行就会出现一个html页面]...
  10. $bzoj1079-SCOI2008$ 着色方案 $dp$
  11. php服务端setcookie()原理
  12. 一些常用路由协议默认的AD值
  13. 中职计算机录取分数线是多少,中职技校录取分数线划定
  14. MATLAB 调用百度云文字识别的具体应用
  15. autocad ios 虚线_教大家AutoCAD2020怎么画虚线的方法
  16. 上传服务器文件代码,文件上传服务器代码
  17. Android UI基础控件
  18. 硬盘和硬盘驱动器的区别
  19. C#实现土豆优酷等网站视频的缩略图
  20. 新产品、新特性、新生态丨一文回顾openGauss峰会云和恩墨分论坛150分钟的精彩...

热门文章

  1. [日语二级词汇]日语二级必会汉字总结3
  2. 视觉RLHF要来了?谷歌复用30年前经典算法,CV引入强化学习
  3. Android 系统内置下载器服务 DownloadManager 的使用
  4. 常用的舆情监测技术分享
  5. ToDolist简述
  6. 【人脸检测】MTCNN网络解析
  7. WPF编程--Modbus通信Demo
  8. json数据导出到excel中
  9. java option请求_Spring boot处理OPTIONS请求
  10. 易观CTO郭炜:如何构建企业级大数据Ad-hoc查询引擎