HTML标签是可以嵌套标签的,而且可以多层嵌套;这就像是在电脑中,一个硬盘可以包含数个文件夹,文件夹中还可以嵌套文件夹。
HTML文档的最外层标签一定是,里面嵌套着元素与元素。元素代表了【网页头】,元素代表了【网页体】,这是最基本的网页结构。
HTML文档和网页的内容一定是一一对应的。只是,【网页头】的内容不会被直接呈现在浏览器里的网页正文中,而【网页体】的内容是会直接显示在网页正文中的。

从HTML文档中,可以看到很多夹在尖括号<>中间的字母,它们叫做【标签】。
标签通常是成对出现的:前面的是【开始标签】,比如;后面的是【结束标签】,如。



style属性可以用来定义网页文本的样式,比如字体大小、颜色、间距、对齐方式等等。
href属性的用法——添加链接,链接一般都由a>标签定义,href属性用于规定指向页面的URL。
网页头里面,定义了class属性,属性值为"book",然后下面一长串代码是对这个class属性的描述;接着再在网页体中调用,所以看到了


id属性和class属性的用法类似,给元素定义id和class的目的都是为了查找、定位元素,或者为元素设置样式。
但id属性用于标识唯一的元素,而class用于标识一系列的元素。id就像是学生的学生证号码,每个人都是唯一的;而学生们可以属于同一个班级,班级就像class。

网页体有三大部分,

元素的部分,

元素的部分,和

元素的部分。

Python爬虫笔记——HTML基础认识相关推荐

  1. 数字图像处理与Python实现笔记之基础知识

    数字图像处理与Python实现笔记之基础知识 摘要 绪论 1 数字图像处理基础知识 1.1 数字图像简介 1.1.1 数字图像处理的目的 1.1.2 数字图像处理的应用 1.1.3 数字图像处理的特点 ...

  2. Python学习笔记_1_基础_2:数据运算、bytes数据类型、.pyc文件(什么鬼)

    Python学习笔记_1_基础_2:数据运算.bytes数据类型..pyc文件(什么鬼) 一.数据运算 Python数据运算感觉和C++,Java没有太大的差异,百度一大堆,这里就不想写了.比较有意思 ...

  3. Python爬虫笔记

    Python爬虫笔记 总体看过程 赋予地址 获取网页信息 获取网页中所需的信息 将得到所需的信息保存到硬盘 总体看过程 爬虫-从网络上爬取所需要的信息,怎么爬取?首先得知道你要去哪里获取(即地址,首先 ...

  4. Python爬虫笔记(3)- 爬取丁香园留言

    Python爬虫笔记(3)- 爬取丁香园留言 爬取丁香园留言:主要用到了模拟登录 爬取丁香园留言:主要用到了模拟登录 import requests, json, re, random,time fr ...

  5. Python爬虫之XPath基础教程:用代码抓取网页数据

    Python爬虫之XPath基础教程:用代码抓取网页数据 在网络时代,网页数据是获取信息和进行分析的最重要的来源之一.Python的爬虫技术让我们可以轻松抓取网页数据,并进行数据处理.XPath是一种 ...

  6. python 图像分析自然纹理方向与粗细代码_数字图像处理与Python实现笔记之基础知识...

    数字图像处理与Python实现笔记之基础知识 摘要 绪论 1 数字图像处理基础知识 1.1 数字图像简介 1.1.1 数字图像处理的目的 1.1.2 数字图像处理的应用 1.1.3 数字图像处理的特点 ...

  7. python爬虫笔记第二章

    前言 你好! 这是基于b站2021年路飞学成爬虫教程的python爬虫学习笔记,主要是方便作者复习和回顾课程内容. 已经发布了第一章和第二章,可以在主页中查看. python爬虫笔记(第二章) 前言 ...

  8. python爬虫实践——零基础快速入门(四)爬取小猪租房信息

    上篇文章我们讲到python爬虫实践--零基础快速入门(三)爬取豆瓣电影 接下来我们爬取小猪短租租房信息.进入主页后选择深圳地区的位置.地址如下: http://sz.xiaozhu.com/ 一,标 ...

  9. Python爬虫笔记汇总

    文中介绍的比较详细的有,requests库,urllib.request库,BeautifulSoup库,re库和正则表达式,Scrapy常用命令. 一.requests库 课程小案例 京东商品详情页 ...

最新文章

  1. [Snipaste]系统截图工具
  2. php 实现二叉树的最大深度_PHP 实现二叉树
  3. vba传值调用_Access VBA如何使用Shell命令以及如何传递参数
  4. Git 企业开发者教程
  5. java在一个类里实现存款_用Java编写一个简单的存款
  6. 联想拯救者y7000加内存条_关于2020款联想拯救者Y7000、R7000和Y7000P,r7000p选哪个好?看这里就对了...
  7. OpenShift Security (5) - 评估部署中的风险
  8. 惰性函数定义模式 网页设计
  9. MatCaffe问题: make matcaffe 'matlab/+caffe/private/caffe_.mexa64' failed
  10. ThinkPHP5学习笔记(6)请求和响应
  11. 调侃《Head First设计模式》之总结篇
  12. python程序打印出10行的杨辉三角_GitHub 标星 6.5w+,Python 小白 100 天学习计划,从新手到玩转!...
  13. 计算机视觉论文-2021-03-31
  14. 【12c】直方图Histograms
  15. java mail 使用:exchange邮箱
  16. 读书笔记:《结构思考力》基于目标定主题
  17. 持久化存储系统本版号
  18. 谷歌浏览器打开后是360导航界面解决办法
  19. 基于elementUI封装了基础表单组件
  20. 互联网公司招聘--去哪儿--产品运营--2014年笔试题

热门文章

  1. 2021世界区块链大会 | 章鱼网络刘毅金句演讲视频
  2. Oracle 11.2.0.4 RAC 手动打补丁
  3. Sqlserver数据库性能优化
  4. go语言-编程基础-go的字符和字符集
  5. 这70道算法题你都会的话,可以直接去字节跳动了!
  6. 如何在最短的时间,一举拿下京东offer!(Java岗)
  7. 简单工厂-工厂方法-抽象工厂
  8. transformer论文解读_一文读懂transformer(CV专享)
  9. php 验证码提交按钮样式,修改thinkphp验证码样式(颜色边框背景)
  10. VxWorks 最小系统移植到全志 A40i CPU 过程中的 bug 修复记录