python3.5 爬取bing搜索结果页面标题、链接
一个简单的爬虫小程序,可以抓取bing输入关键字后第一个页面的标题、链接。
import re,urllib.parse,urllib.request,urllib.error
from bs4 import BeautifulSoup as BSbaseUrl = 'http://cn.bing.com/search?'
word = '鹿晗 吴亦凡 张艺兴'
print(word)
word = word.encode(encoding='utf-8', errors='strict')
#print(word)data = {'q':word}
data = urllib.parse.urlencode(data)
#print(data)
url = baseUrl+data
print(url)try:html = urllib.request.urlopen(url)
except urllib.error.HTTPError as e:print(e.code)
except urllib.error.URLError as e:print(e.reason)soup = BS(html,"html.parser")
td = soup.findAll("h2")
count = soup.findAll(class_="sb_count")
for c in count:print(c.get_text())for t in td:print(t.get_text())pattern = re.compile(r'href="([^"]*)"')h = re.search(pattern,str(t))if h:for x in h.groups():print(x)
运行结果截图:
python3.5 爬取bing搜索结果页面标题、链接相关推荐
- Python3 爬虫 - 爬取 bing 高清桌面大图
引言 看到 bing 的高清大图,觉得质量都很高,都挺好看的,升到 window 10 以后,每次开机的画面都不一样,也觉得很有特点,我们来做一个简单的抓图 Demo 版脚本. 版权所有:_ OE _ ...
- Python3爬取Bing每日图片,并设置为电脑桌面
文章目录 1 - 简述 2 - 核心代码 2.1 - 爬取BingImage 2.2 - 设置为桌面 2.3 - 设置为每日自动执行 3 - 完整代码 4 - 运行结果 作为鄙视链底层的"脚 ...
- Python3:爬取新浪、网易、今日头条、UC四大网站新闻标题及内容
Python3:爬取新浪.网易.今日头条.UC四大网站新闻标题及内容 以爬取相应网站的社会新闻内容为例: 一.新浪: 新浪网的新闻比较好爬取,我是用BeautifulSoup直接解析的,它并没有使用J ...
- 利用python的scrapy框架爬取google搜索结果页面内容
scrapy google search 实验目的 爬虫实习的项目1,利用python的scrapy框架爬取google搜索结果页面内容. https://github.com/1012598167/ ...
- 【python爬虫】爬取Bing词典的单词存到SQLite数据库
爬取Bing词典的单词 打算做一个单词相关的app自己用,那词典从何而来呢? 想到了用爬虫.爬哪里的数据呢? 个人比较喜欢微软的东西,所以打算从Bing翻译爬取单词 Bug 由于Bing翻译的html ...
- python 爬取上海体育彩票文章标题、时间、内容
python期末大作业 爬取上海体育彩票文章标题.时间.内容 并计算词频.生成特殊形状的词云图 利用selenium爬取内容代码: # https://www.shsportslottery.com/ ...
- python3 爬虫 爬取华为应用市场 APP应用评论(一)爬取全部评论——学霸君
python3 爬虫 爬取华为应用市场 APP应用评论(一)爬取全部评论--学霸君 import requests import re import requests from bs4 import ...
- 【Python爬虫学习实践】多线程爬取Bing每日壁纸
在本节实践中,我们将借助Python多线程编程并采用生产者消费者模式来编写爬取Bing每日壁纸的爬虫.在正式编程前,我们还是一样地先来分析一下我们的需求及大体实现的过程. 总体设计预览 首先,我们先来 ...
- python3 爬虫 爬取华为应用市场 APP应用评论(一)爬取全部评论——作业帮
python3 爬虫 爬取华为应用市场 APP应用评论(一)爬取全部评论--作业帮 import requests import re import requests from bs4 import ...
最新文章
- 【css】padding 和 margin的区别
- jawstats php,JAWStats 配置(为AWStats配上华丽的外衣)
- 数据结构与算法分析c++第四版_研分享 | 人工智能学院数据结构与算法分析考研备考整理...
- JMX 与系统管理--转
- [改善Java代码]覆写equals方法必须覆写hashCode方法
- 20150928所学粗略整理
- .Net5 WPF快速入门系列教程
- 改善代码可测性的若干技巧
- WEB安全基础-URL跳转漏洞
- 自定义DataAnnotations
- 特斯拉柏林超级工厂叕被叫停,先交一个亿再说
- JavaScript学习(三十五)—拖动元素
- textBox的Key_Down事件
- 亚马逊首席科学家 李沐:工作五年反思
- bzoj3223Tyvj 1729 文艺平衡树 splay
- ai google 风格化图像_谷歌 AI 新方法:可提升 10 倍图像识别效率,关键还简单易用...
- 电脑屏幕录制软件免费
- Win10显示多个虚拟桌面
- 国美金融贷款绝对定位与相对定位的关系(国美金融贷款位置)
- 计算机网络共享自动关,启用网络发现,重新打开“高级共享设置”对话框,显示仍是关闭状态...
热门文章
- 如何检测笔记本电脑的主板,cpu,硬盘的温度
- Hibernate——入门
- GNN algorithms(3): Tri-party Deep Network Representation
- 经典简单的猜数字小游戏
- qq离线linux,QQ For Linux 我哭了,官方版
- mysql函数 优化_Mysql函数求优化解决思路
- 两分钟理解RAFT光流中的相关层
- MySQL与CVM自建数据库优势_UCloud云数据库MySQL产品优势及与自建数据库对比
- 基础C语言知识串串香10☞数组字符串结构体联合体枚举
- maven引用公共包_maven项目引用外部jar包的方法