from lxml import etree
import requests
# 爬取页面
def get_page(url):resp = requests.get(url)resp.encoding='utf-8'return resp.text# 从页面中提取所需要的信息
def get_info(s):html = etree.HTML(s)divs = html.xpath('/html/body/div[6]/div/div/div[3]/div[5]/div[1]/div')# 将读取的数据写入文件夹里fp = open('d.txt', mode='w',encoding='utf-8')for div in divs:company_name = div.xpath('./div/div/a[1]/div[1]/p/text()')[1][2:]fp.write('公司名称: ' + company_name + '\n')price = div.xpath('./div/div/a[2]/div[2]/div[1]/span[1]/text()')[0].strip('¥')fp.write('价格: ' + price + '\n')product_name = div.xpath('./div/div/a[2]/div[2]/div[2]/p/text()')product_name = ('网站建设').join(product_name)fp.write('产品名称: ' + product_name + '\n')location = div.xpath('./div/div/a[1]/div[1]/div/span/text()')fp.write('地址: ' + str(location[0]) + '\n')fp.write('\n')# 关闭文件fp.close()# 爬取的网址
url = "https://qingdao.zbj.com/search/f/?kw=%E7%BD%91%E7%AB%99%E5%BB%BA%E8%AE%BE"
s = get_page(url)
get_info(s)

输出:

公司名称: 骐翔网络10年老店
价格: 1800
产品名称: PC+手机自适应网站建设|h5响应式网站建设|企业网站建设定制开发
地址: 青岛公司名称: 三盛网络—未来主义设计美学的倡导者
价格: 4500
产品名称:  企业网站建设 网站建设定制 手机网站建设 网站建设制作网站建设设计
地址: 青岛公司名称: 圣融科技有限公司
价格: 2500
产品名称: 开发网站建设制作企业公司网站建设H5响应式网站建设手机微官网
地址: 青岛
...

python爬取猪八戒网的内容相关推荐

  1. python爬取东方财富网资金流向数据(在本地生成csv文件)

    今天我们来试着用python爬取东方财富网资金流向的表格数据. 第一步:程序及应用的准备 首先我们需要安装selenium库,使用命令pip install selenium;然后我们需要下载对应的c ...

  2. 利用python爬取东方财富网股吧评论并进行情感分析(一)

    利用python爬取东方财富网股吧评论(一) python-东方财富网贴吧文本数据爬取 分享一下写论文时爬数据用到的代码,有什么问题或者改善的建议的话小伙伴们一起评论区讨论.涉及内容在前人的研究基础之 ...

  3. python爬取当当网商品评论

    python爬取当当网商品评论 本案例获取某鞋评论作为例 案例目的: 通过爬取当当网商品评价,介绍通过结合jsonpath和正则表达式获取目标数据的方法. 代码功能: 输入爬取的页数,自动下载保存每页 ...

  4. Python爬取豆瓣网影评展示

    Python爬取豆瓣网影评展示 需要的库文件 requests beautifulsoup wordcloud jieba matplotlib 本文思想 1.访问指定的网页 #获取指定url的内容 ...

  5. 用python爬取基金网信息数据,保存到表格,并做成四种简单可视化。(爬虫之路,永无止境!)

    用python爬取基金网信息数据,保存到表格,并做成四种简单可视化.(爬虫之路,永无止境!) 上次 2021-07-07写的用python爬取腾讯招聘网岗位信息保存到表格,并做成简单可视化. 有的人留 ...

  6. Python爬取书包网文章实战总结

    python爬取书包网文章总结 今天闲来无事去看小说,但是发现没办法直接下载,所以呢就用python爬虫来下载一波了,哈哈- 爬取的是这篇小说:剑破九天(是不是很霸气,话不多说,开始-) 总体思路步骤 ...

  7. python爬取当当网的书籍信息并保存到csv文件

    python爬取当当网的书籍信息并保存到csv文件 依赖的库: requests #用来获取页面内容 BeautifulSoup #opython3不能安装BeautifulSoup,但可以安装Bea ...

  8. 利用Python爬取散文网的文章实例

    这篇文章主要跟大家介绍了利用python爬取散文网文章的相关资料,文中介绍的非常详细,对大家具有一定的参考学习价值,需要的朋友们下面来一起看看吧. 本文主要给大家介绍的是关于python爬取散文网文章 ...

  9. 用python爬取高考网历年高考分数线将数据放入MySQL并绘制图表

    用python爬取高考网历年高考分数线 # 导入爬虫的库 import requests from lxml import etree # 导入画图库 from pyecharts.charts im ...

最新文章

  1. python【数据结构与算法】战争之城(分支限界法)
  2. 文巾解题 596. 超过5名学生的课
  3. matlab潮流程序,IEEE33节点matlab潮流程序.doc
  4. 上篇文章中ygc越来越慢的case的原因解读
  5. pythonfor输入多个数字_我一天学会了python最基础的编程
  6. 假如古代有了云计算,延禧攻略里的各位嫔妃要如何宫斗
  7. [小技巧]快速生成验证码
  8. (36)FPGA打N拍设计(第8天)
  9. python 面试题之 生成器
  10. JDBC与MySQL练习
  11. 实现写邮箱html页面,用html写的简单的邮箱登陆界面
  12. GBASE 8s 物理日志缓冲区(Physical-log buffer)
  13. 【夜读】一个人保持年轻的5个好习惯
  14. Arduino引用第三方库ads1x15提示No such file or directory
  15. 华硕服务器主板那个系列好,华硕主板哪个系列好?华硕主板各个系列区别对比...
  16. 文件上传漏洞—一句话图片马制作
  17. 基础知识12.25-12.26
  18. 有哪些免费的思维导图软件?分享两个制作软件给你
  19. Opencv 简单视频播放器
  20. cached in the local repository的解决办法

热门文章

  1. 51单片机 串口通信
  2. html+javascript登录注册界面源码
  3. 有思科账号和思科学院账号后,登陆仍然提示“Sorry, we can’t find…”.【解决Cisco Packet Tracer登陆问题】
  4. 【J1】【队列】报数游戏
  5. 学Android移动开发 第1章 Android基础入门
  6. 魅族flashfire_[FIRE]魅族魅蓝Note2公开版 解锁BL 刷入奇兔中文recovery教程
  7. matlab分形曼德勃罗,曼德勃罗与他的分形几何学
  8. 【浙江省计算机二级office】分享与感想
  9. 手机nfc_如何在Android中编写NFC标签
  10. SSM实现Java版百度网盘系统