1、html标记语言了解

<html>
<meta http-equiv="Content-Type"content="text/html;charset=utf-8">
<h1>我的祖国</h1>
<h1 align="center">我的祖国</h1>
# h1 标签
# align  属性
# center 属性值
<标签 属性="属性值">被标记的内容</标签>
<img src="xxx.jpg"/>
<a href="http://www.baidu.com">百度</a>
</html>

2、BeautifulSoup模块介绍

# 1.拿到页面源代码
# 2.使用bs4进行解析 拿到数据
import requests
from bs4 import BeautifulSoup
import csv
url = "http://www.xinfadi.com.cn/marketanalysis/0/list/1.shtml"
resp = requests.get(url)# # 解析数据
# # 1.把页面源代码交给BeautifulSoup进行处理 生成bs对象
# # page = BeautifulSoup(resp.text)
page = BeautifulSoup(resp.text, "html.parser")
# # 2.从bs对象中查找对象
# # find(标签名,属性=值)
# # find_all(标签名,属性=值)
table = page.find("table", class_="hq_table")  # class 是python中的关键字
# # table = page.find("table", attrs={"class": "hq_table"})  #等价于上一行 可以避免class
# print(table)
# 拿到所有数据行trs = table.find_all("tr")
trs = table.find_all("tr")[1:]
f = open("菜价.csv", mode="w",encoding='utf-8')
csvwriter = csv.writer(f)
for tr in trs:tds = tr.find_all("td")  # 拿到每行的tdprint(tds)name = tds[0].textlow = tds[1].textaverage = tds[2].texthigh = tds[3].textgui = tds[4].textkind = tds[5].textdate = tds[5].textprint(name, low, average, high, gui, kind, date)csvwriter.writerow([name, low, average, high, gui, kind, date])
f.close()
resp.close()

爬虫5-BeautifulSoup模块简解相关推荐

  1. 爬虫5-BeautifulSoup模块简解2

    1.BeautifulSoup简解2 from bs4 import BeautifulSoup import re file = open("./baidu.html",'rb' ...

  2. python3 beautifulsoup 模块详解_关于beautifulsoup模块的详细介绍

    这篇文章主要给大家介绍了python中 Beautiful Soup 模块的搜索方法函数. 方法不同类型的过滤参数能够进行不同的过滤,得到想要的结果.文中介绍的非常详细,对大家具有一定的参考价值,需要 ...

  3. python bs4模块_python爬虫之Beautifulsoup模块用法详解

    什么是beautifulsoup: 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.(官方) beautifulsoup是 ...

  4. 浅谈Python爬虫之BeautifulSoup模块

    目录 ​ 前言 安装库 导入库 解析文档示例 提取数据示例 CSS选择器 实例小项目 总结 前言 BeautifulSoup是主要以解析web网页的Python模块,它会提供一些强大的解释器,以解析网 ...

  5. UE4 RHI与Render模块简解

    UE4中的RHI指的是Render hardware interface,作用像Ogre里的RenderSystem,针对Dx11,Dx12,Opengl等等平台抽象出相同的接口,我们能方便能使用相同 ...

  6. 爬虫五 Beautifulsoup模块详细

    一.基本使用 from bs4 import BeautifulSoup htmlCharset = "GB2312" soup=BeautifulSoup(html_doc,'l ...

  7. Python爬虫笔记——BeautifulSoup模块

    Target:学会用BeautifulSoup解析和提取网页中的数据. [解析数据]:把服务器返回来的HTML源代码翻译为我们能看懂的样子. [提取数据]:是指把我们需要的数据从众多数据中挑选出来. ...

  8. [Python从零到壹] 五.网络爬虫之BeautifulSoup基础语法万字详解

    欢迎大家来到"Python从零到壹",在这里我将分享约200篇Python系列文章,带大家一起去学习和玩耍,看看Python这个有趣的世界.所有文章都将结合案例.代码和作者的经验讲 ...

  9. python爬虫beautifulsoup爬当当网_Python爬虫包 BeautifulSoup 递归抓取实例详解_python_脚本之家...

    Python爬虫包 BeautifulSoup  递归抓取实例详解 概要: 爬虫的主要目的就是为了沿着网络抓取需要的内容.它们的本质是一种递归的过程.它们首先需要获得网页的内容,然后分析页面内容并找到 ...

最新文章

  1. 核磁共振影像数据处理-3-DTI基础、Li‘s have a solution and plan.
  2. Word中快速插入目录
  3. java 数据结构实例_数据结构(Java)——栈的实例
  4. linux嵌入式开发遇到坑不用慌 让你快速提升进度
  5. android内存优化方法,Android开发内存优化注意事项和方法
  6. html怎么做出相框的效果,PS滤镜制作漂亮的实木相框效果
  7. 701. 二叉搜索树中的插入操作
  8. SIAMATIC S7-1200 中通过 Modbus RTU 如何读取地址范围 9999 到 65535 的输入字
  9. Codeforces | CF1029F 【Multicolored Markers】
  10. PHP用301重定向根域名到www域名
  11. 「Algospot」量化QUANTIZE
  12. ZIP压缩输入/输出流
  13. ISO 9001质量管理体系标准概述
  14. Chrome 浏览器架构
  15. linux fdisk等命令,linux命令:fdisk(示例代码)
  16. jeecgboot开发经验过程
  17. 教师招聘计算机面试说课稿,教师招聘面试常见问题_ _信息技术说课稿.doc
  18. WIN32 API GetLastError()返回值含义列表
  19. 关于实现某宝或某妈永久登录
  20. 基础条件查询 where

热门文章

  1. Postman用法简介-Http请求模拟工具
  2. python 猴子补丁_python面试题精讲——monkey patch(猴子补丁)
  3. sqldataadapter.fill 索引超出了数组界限_小学生学习C++||第十五节 数组
  4. Git初学札记(一)————Git简介与安装
  5. 形容人的内核是什么意思_识人核心是什么?
  6. 轮询数据库 java_谁做过定时任务,轮询查询数据。
  7. ROS + OpenCV
  8. php ip2long bug,PHP代码ip2long 循环有关问题
  9. 2021泗阳致远中学高考成绩查询,2021高考成绩什么时候发布?可通过哪些途径查询?...
  10. web服务面试python_Python面试重点(web篇)