16.ajax_case08
# 抓取简书博客总阅读量
# https://www.jianshu.com/u/130f76596b02
import requests
import json
import re
from lxml import etreeheader = {'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8','User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 ''(KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'}def get_all_article_links():links_list = []for i in range(1, 22):url = 'https://www.jianshu.com/u/130f76596b02?order_by=shared_at&page={}'.format(i)response = requests.get(url,headers=header,timeout=5)tree = etree.HTML(response.text)article_links = tree.xpath('//div[@class="content"]/a[@class="title"]/@href')for item in article_links:article_link = 'https://www.jianshu.com' + itemlinks_list.append(article_link)return links_listdef get_read_num():num_list = []links_list = get_all_article_links()for url in set(links_list):response = requests.get(url,headers=header,timeout=5)content = response.textread_num_pattern = re.compile(r'"views_count":\d+')read_num = int(read_num_pattern.findall(content)[0].split(':')[-1])print(read_num)num_list.append(read_num)return num_list# total_read = 0
# for num in get_read_num():
# total_read += num
# read_num_list = get_read_num()
# print('总阅读量 =', sum(read_num_list))
转载于:https://www.cnblogs.com/hankleo/p/10807613.html
16.ajax_case08相关推荐
- 实现手机来电铃声,通知铃声、警告铃声等音频定制化功能(三,多媒体扫描结果定制处理)
本篇博文主要是对MediaScanner中endFile方法的处理流程上的重构,以实现需求中的资源区域化定制.处理思路为首先扫描定制分区中的资源,在扫描系统分区下默认资源时判断定制分区西下是否已经存在 ...
- sqlserver错误码
错误 6,000 到 6,999 错误 严重性 是否记录事件 说明 6001 10 否 SHUTDOWN 正在等待 %d 个进程完成. 6004 10 否 用户没有执行此操作的权限. 6005 10 ...
- Go 1.16 的这个新变化需要适应下:go get 和 go install 的变化
原文地址: Go 1.16 的这个新变化需要适应下:go get 和 go install 的变化 一直以来,go get 用于下载并安装 Go 包.命令等,而 go install 在 module ...
- Ubuntu 16.04 安装后修改屏幕分辨率(xrandr: Failed to get size of gamma for output default)
ubuntu 16.04 安装后分辨率只有一个选项 1024x768,使用 xrandr 命令出现错误: xrandr: Failed to get size of gamma for output ...
- Ubuntu 16.04 安装 Docker - Dependency failed for Docker Application Container
Docker 安装 由于 apt 官方库里的 Docker 版本可能比较旧,所以先卸载可能存在的旧版本: sudo apt-get remove docker docker-engine docker ...
- java 16进制与图片互转
十六进制转成图片 /*** 十六进制转成图片* @author Administrator**/public static void saveToImgFile(String src,String o ...
- 【CV】吴恩达机器学习课程笔记第16章
本系列文章如果没有特殊说明,正文内容均解释的是文字上方的图片 机器学习 | Coursera 吴恩达机器学习系列课程_bilibili 目录 16 推荐系统 16-1 问题规划 16-2 基于内容的推 ...
- python 16进制转10进制, 8进制转10进制, 2进制转10进制的方法
python 16进制转10 进制, 8进制转10进制, 2进制转10进制 可以使用系统自带的 int 方法 具体如下: value = "0x1388" result = int ...
- java.lang.IllegalArgumentException: Can only use lower 16 bits for requestCode
问题出现在在定义一些常量的时候 这个定义的数据不要超过16 ,这个问题就是定义超过了 16 , 用16进制的最好.
最新文章
- python开多少进程合适_用了python多进程,我跑程序花费的时间缩短了4倍
- linux/windows中mysql、oracle、dm数据库连接
- JSON-RPC、XML-RPC、SOAP三者的关系
- Django从理论到实战(part25)--数据库操作
- KeyMob移动广告聚合平台-致力于打造最牛的聚合平台
- 看看这帮猴子的伪原创工具
- CVE-2019-0708漏洞补丁KB4499175
- 数据型驱动风控有什么内容?从蚂蚁借呗与花呗谈起~
- php textarea换行
- 「leetcode」本周小结!(回溯算法系列二)
- 百度时间显示时间_百度SEO需要多长时间以及如何加快排名?
- js实现椭圆轨迹_javascript椭圆旋转相册实现代码
- SAP License:SAP五大主流ERP一览
- ie 验证码图片不显示解决
- 数码数字字体_拍中画幅胶片能不能用数码相机测光?
- FFFfrance博客介绍
- 盗版xp成功验证成正版,享受正版增值服务!(转)
- MessageBox中涉及到的宏定义
- MySQL练习题(4)
- 个人自建数据库和云数据库有什么区别?