抓取我自己csdm博客信息的标题和文章链接,并存入文件夹

一、抓取信息

分析:
1、我们要找到自己所要抓取的链接的xpath
右键:检查元素-》xpath

代码:

from lxml import  etree#调用的函数
import requests #调用的函数
r=requests.get('https://blog.csdn.net/weixin_41665637').content#被测地址
topic=etree.HTML(r)
html=topic.xpath("//main/div/div/h4/a/@href")#抓取链接
title=topic.xpath("//main/div/div/h4/a/text()")#抓取标题
#
print(html)
print(title)

结果

python实战演练一:抓取我自己csdm博客信息的标题和文章链接,并存入文件夹《抓取信息》相关推荐

  1. 爬取掘金 开发者头条 博客园等我需要的文章

    先说下 我的 爬取结果连接  http://craw.cibn.top/ 我是一个很懒的人 但是每天为了进步还是要看一下 各大社区  掘金啊 csdn  开发者头条 博客园 等,毕竟这年头程序员不学习 ...

  2. 如何控制Yahoo! Slurp蜘蛛的抓取频度_国外博客资源站_百度空间

    如何控制Yahoo! Slurp蜘蛛的抓取频度_国外博客资源站_百度空间 如何控制Yahoo! Slurp蜘蛛的抓取频度 2009年08月13日 星期四 5:56 上周末豆瓣的阿北给我电话:最近你们雅 ...

  3. 基于python爬虫的论文标题_Python3实现爬取简书首页文章标题和文章链接的方法【测试可用】...

    本文实例讲述了Python3实现爬取简书首页文章标题和文章链接的方法.分享给大家供大家参考,具体如下: from urllib import request from bs4 import Beaut ...

  4. 【爬虫】利用Python爬虫爬取小麦苗itpub博客的所有文章的连接地址并写入Excel中(2)...

    [爬虫]利用Python爬虫爬取小麦苗itpub博客的所有文章的连接地址并写入Excel中(2) 第一篇( http://blog.itpub.net/26736162/viewspace-22865 ...

  5. python刷今日头条访问量_Python 自动刷博客浏览量实例代码

    怎么利用python爬取csdn博客访问量例子 如何使用python来爬取自己博客访问量承认吧,小编们都是在深夜里崩溃的俗人.晚安,世界. 博客网站上有访问量这个记录么 如果有就可以抓取网站下来,正则 ...

  6. 一文搞定scrapy爬取众多知名技术博客文章保存到本地数据库,包含:cnblog、csdn、51cto、itpub、jobbole、oschina等

    本文旨在通过爬取一系列博客网站技术文章的实践,介绍一下scrapy这个python语言中强大的整站爬虫框架的使用.各位童鞋可不要用来干坏事哦,这些技术博客平台也是为了让我们大家更方便的交流.学习.提高 ...

  7. python处理gzip压缩的http数据 - XII - 博客大巴

    python处理gzip压缩的http数据 - XII - 博客大巴 python处理gzip压缩的http数据 - XII - 博客大巴 python处理gzip压缩的http数据 - [pytho ...

  8. VB选择文件夹并取文件夹名

    代码如下: '引用Microsoft Shell Controls And Automation Dim ShellA As New Shell Private Sub Command1_Click( ...

  9. Python -- 堆数据结构 heapq - I love this game! - 博客频道 - CSDN.NET

    Python -- 堆数据结构 heapq - I love this game! - 博客频道 - CSDN.NET Python -- 堆数据结构 heapq - I love this game ...

  10. 【Python开发】Flask开发实战:个人博客(三)

    Flask开发实战:个人博客(三) 在[Python开发]Flask开发实战:个人博客(一) 中,我们已经完成了 数据库设计.数据准备.模板架构.表单设计.视图函数设计.电子邮件支持 等总体设计的内容 ...

最新文章

  1. 后台CS代码中创建四种常用的SL动画效果
  2. android用openGl ES绘制任意方程的三维空间图形
  3. python—多线程之线程之间共享数据(Queue)
  4. 一个表格中文字怎么换行_Excel表格中怎样快速将阿拉伯数字转化为大写文字?这样操作一键完成...
  5. 光流法测试代码_高效的企业测试-工作流和代码质量(4/6)
  6. Linux-进程管理
  7. python 动态链接库_Python调用dll动态链接库(下)
  8. 恶魔的指纹---49幅由算法生成的七芒星图像
  9. 安卓系统和安卓服务器地址,给安卓应用配置服务器地址
  10. 使用phpquery采集小说
  11. 2018年 - 年终总结
  12. 【游戏】蔚蓝与空洞骑士
  13. pycharm切换python环境_在PyCharm的 Terminal(终端)切换Python版本的方法
  14. 杰理之微信语音前2S声音小修改【篇】
  15. 2018 最新直播接口
  16. 太极定二仪,清浊始以形:红黑树的实现和性质
  17. GC8418 数字光纤音频解码芯片 光纤解码芯片 MS8412替代
  18. ps 2022 保存打开文件闪退解决方法
  19. XDOC Office 7.5.0发布
  20. 最关心的是期货开户手续费和保证金

热门文章

  1. python将英文翻译为中文_Python中英文翻译工具
  2. SW-1、SW-2 通过 VSF 技术形成一台虚拟的逻辑设备
  3. YOLO v2详细解读
  4. 软件工程7条基本原理
  5. AD15怎么导入图片做丝印 或者做 LOGO
  6. 语音识别技术基础知识
  7. 图像降噪算法——从BM3D到VBM4D
  8. HelloWorld
  9. 设计模式---订阅发布模式(Subscribe/Publish)
  10. linux搭建steam服务器吗,如何在Linux系统服务器中安装steam play