全代码分析

第一部分:

import requests
from bs4 import BeautifulSoupsession = requests.session()
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.193 Safari/537.36'
}

#header可以从All或者XHR中任意一条中找到,都是一样的

第二部分:

def sign_in():#带参数请求登陆url_login = 'https://xiaoke.kaikeba.com/example/wordpress/wp-login.php?action=postpass'data_login = {'post_password':'xiaoke123','Submit': '提交'
}    res=session.post(url_login, headers=headers, data=data_login)print(res.status_code)

url_login和data_login都是第一次输入密码后登陆进去的页面中找到的


第三部分

def get_content():url='https://xiaoke.kaikeba.com/example/wordpress/2019/11/07/互联网圈炸锅啦!有人要帮你加薪啦!/'#url='https://xiaoke.kaikeba.com/example/wordpress/2019/11/07/%e4%ba%92%e8%81%94%e7%bd%91%e5%9c%88%e7%82%b8%e9%94%85%e5%95%a6%ef%bc%81%e6%9c%89%e4%ba%ba%e8%a6%81%e5%b8%ae%e4%bd%a0%e5%8a%a0%e8%96%aa%e5%95%a6%ef%bc%81/'res_article = session.get(url,headers=headers)# 获取数据print(res_article.status_code)#判断获取结果是否为空bs_article = BeautifulSoup(res_article.text,'html.parser')#解析数据article= bs_article.find('div',class_='entry-content').textprint(article)

  • 因为html里面有我们想要的内容,所以用bs解析,url直接从顶端接口处获得,两种url是一样的
  • res_article=session.get(), 不能使用requests.get(), 否则会出现:

这是一篇受密码保护的文章,您需要提供访问密码:
密码:

说明session可以保存之前登陆输入的密码

第四部分

sign_in()
get_content()

完整版代码:

import requests
from bs4 import BeautifulSoupsession = requests.session()headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.193 Safari/537.36'
}def sign_in():#带参数请求登陆url_login = 'https://xiaoke.kaikeba.com/example/wordpress/wp-login.php?action=postpass'data_login = {'post_password':'xiaoke123','Submit': '提交'
}    res=session.post(url_login, headers=headers, data=data_login)print(res.status_code)def get_content():#url='https://xiaoke.kaikeba.com/example/wordpress/2019/11/07/互联网圈炸锅啦!有人要帮你加薪啦!/'url='https://xiaoke.kaikeba.com/example/wordpress/2019/11/07/%e4%ba%92%e8%81%94%e7%bd%91%e5%9c%88%e7%82%b8%e9%94%85%e5%95%a6%ef%bc%81%e6%9c%89%e4%ba%ba%e8%a6%81%e5%b8%ae%e4%bd%a0%e5%8a%a0%e8%96%aa%e5%95%a6%ef%bc%81/'res_article = session.get(url,headers=headers)# 获取数据,传入数参数,第一个为url,第二个为请求头print(res_article.status_code)#判断获取结果是否为空bs_article = BeautifulSoup(res_article.text,'html.parser')#解析数据article= bs_article.find('div',class_='entry-content').text# 查找最小父级标签print(article)

第9节-学会使用cookie-互动练习-“解密加密文章”相关推荐

  1. cookie无法读取bdstoken_第二章(第12节):cookie操作

    有时候我们需要验证浏览器中 cookie 是否正确,因为基于真实 cookie 的测试是无法通过白盒和集成测试进行的.WebDriver 提供了操作 cookie 的相关方法,可以读取.添加和删除 c ...

  2. 第10章第22节:使用Silk互动生成流光艺术图片 [PowerPoint精美幻灯片实战教程]

    当前网站是互动生成艺术图片的创意网站,您可以通过移动鼠标,绘制对称的流光效果. 在此处按下并向下方拖动,继续绘制对称流光效果. 点击此处的图标,撤消上一步的操作. 继续撤消上一步的操作. 点击此处的图 ...

  3. 某某找房cookie必要参数acw_sc__v2加密

    仅供学习交流 禁止商用 如有违规操作联系我删除 1.无痕浏览器打开网页界面 F12抓包查看请求: 进入无限debugger 禁止他人调试 解决的方法有很多: 1.console里面输入Function ...

  4. 学会运用爬虫框架 Scrapy各类技术文章大汇总

    搜索到最好的关于反爬虫的文章. 上篇文章介绍 Scrapy 框架爬取网站的基本用法.但是爬虫程序比较粗糙,很多细节还需打磨.本文主要是讲解 Scrapy 一些小技巧,能让爬虫程序更加完善. https ...

  5. 浅谈javascript的原型和原型链(新手懵懂想学会原型链?看这篇文章就足够啦!!!)

  6. 抖音提取ttnetCookieStore.xml,cookie参数PHP解密

    抖音提取ttnetCookieStore.xml部分参数片段如下: <string name="http://snssdk.com/|odin_tt">aced0005 ...

  7. 墨斗互动助力金茂物业萌宠撒欢节 文明养宠正当行

    6月19日下午,金茂物业主办.北京亚海恒业会展有限公司(简称"亚海会展")承办的萌宠撒欢节"金茂首届茂Lin里主题生活PARTY"在北京广渠金茂薈会所欢乐举行. ...

  8. 互动教程 for Xcode10 and Swift4.2

    ◈ 不看视频不看书,史上最好玩的Xcode 10.0教程 ◈ 利用手指来互动式学习Xcode 10.0 ◈ 单击.双击.长按.拖动及Xcode各种快捷键,就像您在真正的Xcode上操作一样 ◈ 比观看 ...

  9. 《Swift4.0互动教程》正式发布

    免费下载地址:https://itunes.apple.com/cn/app/id1320746678 ◈ 不看视频不看书,手把手带您学习Swift语言 ◈ 利用手指来互动式学习Swift 4.0 ◈ ...

  10. JavaScript 操作 Cookie

    从事web开发也有些日子了,cookie 是个啥差不多能说明白,可是实际自己一上手操作就是得去搜索(你们懂的),结果被鄙视了...所以就写一篇博文做为自己的学习笔记,嘿嘿,博客的好处在此体现出来了. ...

最新文章

  1. 软件设计应该遵循的基本原则有哪些?
  2. ide硬盘接口图 sata硬盘接口图 SCSI硬盘接口图
  3. Intel Realsense D435 是否启动pipeline.start()就开始传输帧,还是只有我们调用wait_for_frames()函数时它才会传输帧?(任务管理器USB带宽内存测试)
  4. 【机器视觉】 HDevelop语言基础(一)-基本类型和常量
  5. Docker 概念解析
  6. html页面可以用在webview,使用WebView加载HTML代码
  7. 在做自动化测试之前你需要知道的
  8. 教你win10系统无法识别语音识别的解决方法
  9. Java常用算法手册-01算法概述
  10. Louvain算法介绍
  11. 吃鸡服务器维护公告10月19日,绝地求生10月30日维护公告更新内容 今天吃鸡几点开服时间...
  12. 浙大mooc翁凯 C语言笔记
  13. 《计算机网络教程》(微课版 第五版)第四章 网络层与网络互连 课后习题及答案
  14. [五]基础数据类型之Short详解
  15. 你知道什么是真正的勇敢?
  16. 计算机网盘变成红色是怎么回事,电脑小知识:硬盘变红了会带来哪些危害?
  17. 2023除夕倒计时~HTML代码
  18. TPM零知识学习七 —— tpm模拟器安装
  19. erlang 虚机CPU 占用高排查
  20. Linux从入门到入狱-01

热门文章

  1. Google Map MarkerCluster 点聚合使用简介
  2. PCB焊接——原理篇
  3. Timesnet: Temporal 2d-variation modeling for general time series analysis
  4. MySQL基础 - 简单查询
  5. 虚拟盘客户机文件盒服务器不一样,VMware ESX三种虚拟磁盘类型分析
  6. java上传文件夹文件
  7. 2015阿里巴巴校招网上笔试
  8. java中awt和swing是什么关系
  9. 用Excel或WPS做两独立样本的T检验
  10. python 图形可视化_Python数据可视化-图形,python,曲线图