1web请求

1服务器渲染 在服务器那边直接把数据和html整合在一起,统一返回给浏览器
             在页面源代码中可以看到数据
2客户端渲染 第一次请求只拿到html骨架,
             第二次请求拿到数据,进行数据分析
             在页面源代码中看不到数据

熟练使用浏览器抓包工具:检查(F12)-network-header,preview

2http协议

协议:数据间传输的规则
HTTP协议:超文本传输协议,用于从www 服务器传输超文本到本地浏览器的传送协议。
浏览器和服务器之间的数据交互遵守的就是HTTP协议请求
# 请求行->请求方式(get post) 请求url地址 协议
# 请求头->放一些服务器使用的附加信息
# 请求体->一般放请求参数响应
# 状态行->协议 状态码
# 响应头->放一些客户端要使用的附加信息
# 响应体->服务器返回的真正客户端要用的内容(Html json)# 请求头中最常见的一些重要内容(爬虫内容):
# 1.User-Agent:请求载体的身份标识(用啥发送的请求)
# 2.Referer:防盗链(这次请求是从哪个页面来的 反爬会用到)
# 3.cookie:本地字符串数据信息(用户登录信息 反爬的token)# 响应头中的一些重要的内容:
# 1.cookie:本地字符串数据信息(用户登录信息,反爬的token)
# 2.各种神奇的莫名其妙的字符串# 请求方式:
# get:显式提交
# post:隐式提交

爬虫2-web请求与http协议相关推荐

  1. web网络和http协议(了解域名和网页,制作第一个网页,了解http协议,流程和请求报文格式)

    文章目录 web网络和http协议 了解域名 早期使用HOST文件解析域名 现在DNS(Domain Name system 域名系统) 域名的概述 域名空间结构 域名介绍 域名注册 域名注册步骤 网 ...

  2. python爬虫入门教程--快速理解HTTP协议(一)

    http协议是互联网里面最重要,最基础的协议之一,我们的爬虫需要经常和http协议打交道.下面这篇文章主要给大家介绍了关于python爬虫入门之快速理解HTTP协议的相关资料,文中介绍的非常详细,需要 ...

  3. 基础网络爬虫(Web crawler)相关技术浅析

    文章目录 前言 基本概念 Robots协议 基本原理 现状概况 爬虫软件 跨语言 Selenium Python urllib requests Scrapy Pyspider Java WebMag ...

  4. [Python爬虫] 2-网络请求

    # I.urllib库:最基本的网络请求库,可以模拟浏览器的行为,向指定的服务器发送一个请求,并且可以保存返回的数据,常用函数如下: # 1)urlopen:抓取内容 from urllib impo ...

  5. Python网络爬虫第一课----Python网络爬虫基础《http和https协议》

    Python网络爬虫第一课----Python网络爬虫基础<http和https协议> 一.HTTP协议 1.官方概念: HTTP协议是Hyper Text Transfer Protoc ...

  6. 网络爬虫(Web crawler)|| 爬虫入门程序

    网络爬虫 网络爬虫(Web crawler),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本 爬虫入门程序 环境准备 JDK1.8 IntelliJ IDEA IDEA自带的Maven 环境 ...

  7. 一个完整的 Web 请求到底发生了什么

    阅读本文大概需要 7 分钟. 一.从输入一个网址开始 当我们在浏览器输入一个网址,然后按下回车,接下来浏览器显示了页面.网速好的话这之间可能就一秒,但在这一秒内到底发生了什么? 本文主要内容是试图记录 ...

  8. 深入理解WEB请求过程

    随着web2.0时代的到来,互联网的网络架构已经从传统的C/S架构转变成更加方便快捷的B/S架构,B/S架构大大简化了用户使用网络应用的难度,带来了以下两方面的好处: 1.客户端使用统一的浏览器.由于 ...

  9. php如何处理查询请求,PHP如何处理Web请求流程

    PHP世界里涌现了很多开发框架,比如Laravel.ThinkPHP等,但不论何总框架,他们在处理Web请求时的模式都是一样的,本文首先阐述PHP开发Web应用的基本架构,然后分别分析Laravel和 ...

最新文章

  1. 016-热更新之FishingJoy一
  2. 伤疤好了有黑印怎么办_搞笑gif动态图片:“发现相亲对象的闺蜜更有实力,我后悔了”哈哈哈好一个见色起意...
  3. 配置虚拟机和网络配置
  4. 2008 R2 Server core 下的常用命令
  5. python鸭制作类代码_Python动态语言与鸭子类型详解
  6. 模型开发:拥抱张量运算
  7. Python 标准库 —— cgi/html
  8. jQuery 源码系列(二)init 介绍
  9. 笔记5 bean的作用域
  10. jQuery:设置body的背景
  11. ubuntu18.04配置ORB-SLAM3
  12. 全志h3通用固件_全志h3芯片安卓版固件
  13. 可视化实验五:大数据可视化工具—NodeXL
  14. php解决时间超过2038年
  15. 阿里云备案流程(终于去掉8080端口也能访问网站)
  16. 【thinkphp 基础 3】配合phpstudy进行验证码拓展安装
  17. lua的演进 lua的历史
  18. chm文件导入java_java API的chm文件制作
  19. 八成家用智能摄像头存泄密风险 破解后可窃取实时画面
  20. 阿里云数据盘挂载完整过程

热门文章

  1. 学习Spring Boot:(五)使用 devtools热部署
  2. RabbitMQ保姆级教程
  3. vb6 datagrid表格垂直居中_老板不喜欢看你的Excel表格,学完这些美化技巧,早日升职加薪...
  4. 哈工大计算机学院成立,哈工大计算机科学与技术学院简介
  5. JS在html中加法器,JavaScript_JavaScript程序设计之JS调试,本文主要通过一个加法器,介 - phpStudy...
  6. java开发怎么优化代码,代码优化,该如何处理
  7. datagridview设置为勾选才可编辑_使用lightroom前,做好这几项设置,有助于更好使用...
  8. android怎样判断插入数据是否成功_MySQL一个表的自增id用完了,背井大佬让我用这些姿势再往里插数据...
  9. java 异步调用webapi_Async Await异步调用WebApi
  10. php文件上传漏洞防御,第十二课 php文件上传漏洞和代码防御