python爬取凤凰新闻_python爬虫凤凰网新闻
首先使用chrome浏览器,找到网页要爬取内容的代码,鼠标选中,右键,选择菜单项“检查”
之后,就会在页面下方该选中位置的源代码,
这时,就可以查看class, p, title等标签。写python代码进行爬取了。
爬取凤凰新闻页面的新闻标题,简介,时间和链接。
代码如下:
import requests
from bs4 import BeautifulSoup
web_data =requests.get('http://news.ifeng.com/listpage/101231/1/list.shtml')
soup = BeautifulSoup(web_data.text,'lxml')
a = 1
for data in soup.select('.box_list'):
detail =data.select('.box_txt p')[0].text
time =data.select('span')[0].text
title =data.select('h2 a')[0]['title']
link =data.select('h2 a ')[0]['href']
print('%d.'%a,title,link,detail,time)
a = a+1
print("新闻条数:",a-1)
爬取截图如下:
python爬取凤凰新闻_python爬虫凤凰网新闻相关推荐
- python爬取cctalk视频_python爬虫urllib使用和进阶 | Python爬虫实战二
python爬虫urllib使用和进阶 上节课已经介绍了爬虫的基本概念和基础内容,接下来就要开始内容的爬取了. 其实爬虫就是浏览器,只不过它是一个特殊的浏览器.爬取网页就是通过HTTP协议访问相应的网 ...
- python爬取豆瓣小组_Python 爬虫实例+爬取豆瓣小组 + wordcloud 制作词云图
目标 利用PYTHON爬取如下图中所有回答的内容,并且制作词云图. 用到的库 import requests # import json from PIL import Image from pyqu ...
- python爬取控制台信息_python爬虫实战之爬取智联职位信息和博客文章信息
1.python爬取招聘信息 简单爬取智联招聘职位信息 # !/usr/bin/env python # -*-coding:utf-8-*- """ @Author ...
- python爬取新闻网站内容_python爬虫案例:抓取网易新闻
此文属于入门级级别的爬虫,老司机们就不用看了. 本次主要是爬取网易新闻,包括新闻标题.作者.来源.发布时间.新闻正文. 首先我们打开163的网站,我们随意选择一个分类,这里我选的分类是国内新闻.然后鼠 ...
- python爬取网页停止_Python爬虫之爬取静态网页
所谓网络爬虫,通俗的讲,就是通过向我们需要的URL发出http请求,获取该URL对应的http报文主体内容,之后提取该报文主体中我们所需要的信息.所以,想要学习python爬虫,需要具备一些http的 ...
- python爬取收费素材_Python爬虫练习:爬取素材网站数据
前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 在工作中的电子文案.ppt,生活中的新闻.广告,都离不开大量的素材,而素材 ...
- python爬取多页_Python 爬虫 2 爬取多页网页
本文内容: Requests.get 爬取多个页码的网页 例:爬取极客学院课程列表 爬虫步骤 打开目标网页,先查看网页源代码 get网页源码 找到想要的内容,找到规律,用正则表达式匹配,存储结果 Re ...
- python爬取小说基本信息_Python爬虫零基础实例---爬取小说吧小说内容到本地
Python爬虫实例--爬取百度贴吧小说 写在前面本篇文章是我在简书上写的第一篇技术文章,作为一个理科生,能把仅剩的一点文笔拿出来献丑已是不易,希望大家能在指教我的同时给予我一点点鼓励,谢谢. 一.介 ...
- python爬取bilibili弹幕_Python爬虫爬取Bilibili弹幕过程解析
先来思考一个问题,B站一个视频的弹幕最多会有多少? 比较多的会有2000条吧,这么多数据,B站肯定是不会直接把弹幕和这个视频绑在一起的. 也就是说,有一个视频地址为https://www.bilibi ...
- python爬取股票评论_Python爬虫股票评论,snowNLP简单分析股民用户情绪
原标题:Python爬虫股票评论,snowNLP简单分析股民用户情绪 一.背景 股民是网络用户的一大群体,他们的网络情绪在一定程度上反映了该股票的情况,也反映了股市市场的波动情况.作为一只时间充裕的研 ...
最新文章
- 使用c#訪问Access数据库时,提示找不到可安装的 ISAM
- 如何在WPF中通过XAML代码创建菜单项
- 使用Phar来打包发布PHP程序
- 求斐波那契数列前n项的值
- php将从数据库取出的数据分为6个一组的二维数组
- echarts_部分图表配置_图表click事件
- C++ opengl 天空盒的创建
- pandas 数据处理进阶
- c++重载++和--
- 大数据处理系统有哪些
- java contenttype_SpringMVC Content-Type解析
- PS2019橡皮擦工具、背景橡皮擦工具、魔术橡皮擦工具
- PHPStorm长时间Updating Indices
- 新战投入场,苏宁易购迎来破局发展新开端
- mysql如何创建用户代码_mysql 创建用户 并 受权_mysql
- 【脚本】网页端微信读书书架中书籍详细信息
- android textview 文字倒影,textview 倒影
- android夯实总结(设计、细节及思想)
- 信用卡当天还款当天刷有风险吗?-民兴
- 计算机怎么解除c盘用户权限,电脑c盘没有权限如何恢复_win10系统c盘没有管理员权限怎么设置-系统城...
热门文章
- 人大金仓数据库的备份与还原
- ArcGis-学习笔记6-4 空间插值简介
- HAL库 配置的 MAX262 程控滤波器F4 F103C8T6
- 视频监控流媒体服务器工作原理,流媒体服务器传输基本原理
- (UE4 4.20)UE4 碰撞(Collision)之光线检测(RayTrace )
- css建立一个简单的设备登记表,员工登记表格的CSS块
- 医疗物联网的定义的业务场景
- 奔图3305_奔图 Pantum P3305DN 驱动
- U盘量产工具_修复、U盘写保护无法格式化、U盘文件乱码格式
- MapReduce实现QQ好友推荐