取出一个html格式的正文和链接,代码:

html_doc = """
<html><head><title>The Dormouse's story</title></head>
<body>
<p class="title"><b>The Dormouse's story</b></p><p class="story">Once upon a time there were three little sisters; and their names were
<a href="http://example.com/elsie" class="sister" id="link1">Elsie</a>,
<a href="http://example.com/lacie" class="sister" id="link2">Lacie</a> and
<a href="http://example.com/tillie" class="sister" id="link3">Tillie</a>;
and they lived at the bottom of a well.</p><p class="story">...</p>
"""
from bs4 import BeautifulSoup
soup = BeautifulSoup(html_doc,'lxml')for link in soup.find_all('a'):print link.get('href')
print(soup.get_text())

学习笔记:
1、get_text()方法,返回tag中的文本内容。

python中BeautifulSoup简单使用相关推荐

  1. Python中yield简单用法

    Python中yield简单用法 你或许知道带有yield的函数在Python中被称之为generator,那何为 generator? 我们暂时抛开generator,先从一个常见编程题目开始,循序 ...

  2. python使用spark_如何在Python中编写简单代码,并且速度超越Spark?

    全文共3482字,预计学习时长7分钟 如今,大家都在Python工具(pandas和Scikit-learn)的简洁性.Spark和Hadoop的可扩展性以及Kubernetes的操作就绪之间做选择. ...

  3. python 字节流分段_如何在Python中编写简单代码,并且速度超越Spark?

    全文共 3482字,预计学习时长 7分钟 如今,大家都在Python工具(pandas和Scikit-learn)的简洁性.Spark和Hadoop的可扩展性以及Kubernetes的操作就绪之间做选 ...

  4. 五分钟理解yield在python中的简单用法,让你不再迷惑

    很多同学无论是在学习python还是使用python的过程中,都会遇到yield关键字,这个让人头大的问题,今天,就给大家分享一下我自学yield的心路历程 基本概念: (1)在 Python 中,使 ...

  5. redis基础入门及Python中的简单使用

    1.什么是Redis? Redis是由意大利人Salvatore Sanfilippo(网名:antirez)开发的一款内存高速缓存数据库.Redis全称为:Remote Dictionary Ser ...

  6. python中beautifulsoup是什么库_BeautifulSoup库详解(个人整理)

    BeautifulSoup4是爬虫必学的技能.BeautifulSoup最主要的功能是从网页抓取数据,Beautiful Soup自动将输入文档转换为Unicode编码,输出文档转换为utf-8编码. ...

  7. python 中BeautifulSoup入门

    什么是BeautifulSoup? Beautiful Soup 是用Python写的一个HTML/XML的解析器,它可以很好的处理不规范标记并生成剖析树(parse tree). 它提供简单又常用的 ...

  8. python中beautifulsoup的作用_python 中BeautifulSoup入门

    在前面的例子用,我用了BeautifulSoup来从58同城抓取了手机维修的店铺信息,这个库使用起来的确是很方便的.本文是BeautifulSoup 的一个详细的介绍,算是入门把.文档地址:http: ...

  9. Python使用BeautifulSoup简单实现爬取妹子mm图片--初级篇

    先来个效果截图(屈服在我的淫威之下吧!坏坏...嘿0.0) 因为是简易版而且是自己写着玩玩而已,自己也刚学,亦是笔记亦是分享,大佬轻喷就好.主要目的是希望更多人能够体验爬取一些seqing图片的 快乐 ...

最新文章

  1. 指针 混用 迭代器_对比 C++ 和 Python,谈谈指针与引用
  2. 在ASP.NET中将图片存储到Sql Server数据库中
  3. python与c语言在语法上的区别-Python与C语言基础对比(Python快速入门)
  4. Linux shell脚本编程(一)
  5. LeetCode 950. 按递增顺序显示卡牌(deque)
  6. Android平台RTMP推流或轻量级RTSP服务(摄像头或同屏)编码前数据接入类型总结
  7. 计算机基础0018,自学考试计算机用基础 0018复习资料.doc
  8. 查看Linux版本命令
  9. Kaggle信用卡欺诈数据
  10. win10计算机策略配置文件,Windows10怎么重置所有本地组策略设置
  11. 解决IE浏览器无法访问此页面
  12. 12月21诛仙服务器维护,12月24日全服停机更新维护公告
  13. 通用发票在线OCR识别,报销场景适用,支持近20种票据
  14. 利用python编程实现音频剪辑
  15. 如果有一天我老无所依,请把我埋在这春天里
  16. 修真院七种教学工具之学习日报
  17. g 最新编译器linux,Linux下安装gcc 、g++ 、gfortran编译器
  18. VBA增加sheet,重名时自动命名
  19. Java基础(自己总结)
  20. 了解JavaScript中的Promise

热门文章

  1. python绘制简单直方图-python plotly绘制直方图实例详解
  2. python下载大文件-使用请求在python中下载大文件
  3. python for-python循环
  4. python编程入门到实践目录-Python编程从入门到实践笔记——文件
  5. 小白学python买什么书-0基础小白学python有没有什么书可以推荐的?
  6. 学python有哪些用途-初入门学习python有哪些用途?
  7. python入门练习题-Python入门36道经典练习题
  8. Linux桌面环境与命令行环境切换快捷键,以及linux 图形界面 X Server 关闭 启动
  9. PHP的DES加解密函数 与JAVA兼容
  10. LeetCode Power of Three