python简单爬虫

指定汉字的笔画动图下载

分析过程

  1. 打开网址首页http://www.hanzi5.com

  2. 选择一个字,比如“虐”

  3. 查看该汉字动图地址

    右键该汉字动图,选择在新标签页打开
    得到该图片的地址
    https://www.hanzi5.com/assets/bishun/animation/8650-bishun.gif

    这里也可以查看网页代码来得到汉字动图地址
    右键汉字动图,选择检查


    右侧控制台,显示

    同样得到汉字动图地址

  4. 多查看几个动图的地址
    “掠”https://www.hanzi5.com/assets/bishun/animation/63a0-bishun.gif
    “扁”https://www.hanzi5.com/assets/bishun/animation/6241-bishun.gif
    “龙”https://www.hanzi5.com/assets/bishun/animation/9f99-bishun.gif
    猜测不同的部分应该是汉字对应的编码

  5. 确定动图地址不同的部分是什么编码类型(utf-8,unicode,gbk16进制字符)
    在控制台js环境输入 ‘\u9f99’ 得到 ,说明是Unicode编码

  6. 接下来对汉字进行编码,得到所需编码

    9f99提取出来

    再将字节型转换为字符型

  7. 将得到的所需编码填入到动图地址中更换,即可得到任意汉字的动图地址

  8. 根据动图地址将图片下载即可

代码实现

import requestsdef get_gif(word):url="https://www.hanzi5.com/assets/bishun/animation/"gif_name=word.encode('unicode_escape')[-4:].decode('ascii')+"-bishun.gif"r=requests.get(url+gif_name)print("正在下载"+word+"的笔画动图")with open("D:/{0}.gif".format(word),'wb') as f:f.write(r.content)if __name__=='__main__':word_list='你好骚啊'for word in word_list:get_gif(word)

python简单爬虫 指定汉字的笔画动图下载相关推荐

  1. python简单爬虫

    python简单爬虫某网站简历模板 from lxml import etree import requestsdef main():url = "https://sc.chinaz.com ...

  2. Python 简单爬虫下载小说txt

    Python 简单爬虫下载小说txt #第一次写爬虫代码 欢迎交流指正 我们范例爬取的对象是笔趣阁的<圣墟> (最近非常火的连载小说) ##为什么选择笔趣阁# 主要是因为笔趣阁的源代码没有 ...

  3. Python简单爬虫第六蛋!(完结撒花)

    第六讲: 今天我们来实战一个项目,我本人比较喜欢看小说,有一部小时叫<圣墟>不知道大家有没有听说过,个人觉得还是不错的,现在联网的时候,都可以随时随地用手机打开浏览器搜索查看,但是有时候也 ...

  4. python 简单图像处理(13) 二值图腐蚀和膨胀,开运算、闭运算

    原文:http://www.cnblogs.com/xianglan/archive/2010/12/29/1921211.html python 简单图像处理(13) 二值图腐蚀和膨胀,开运算.闭运 ...

  5. python课程开课吧怎么样-开课吧最新廖雪峰Python商业爬虫课程,全套完整课程资源下载...

    课程目录 网络爬虫 简介 .爬虫的价值 .爬虫的合法性问题 .通用爬虫与聚焦爬虫 HTTP与HTTPS .HTTP原理 .HTTP和HTTPS .HTTP请求过程 .get和post请求 .常用请求报 ...

  6. Python把mp4视频转化成gif动图

    Python把mp4视频转化成gif动图 平时在CSDN写博客的时候我喜欢放一张作品的效果展示上去,具体步骤是先用录屏软件录下展示的过程,然后再把录屏的mp4视频通过一些在线转换视频格式的网站转化成g ...

  7. 每天一个前端小技巧——生成gif动图下载

    每天一个前端小技巧--生成gif动图下载 动态热图的展现,分别展现某个时间段的热图时间变化,例如:最近一周七天内,每天的热图分布变化图:这个动态变化的图生成一个gif图提供下载是否可行? 实现方案: ...

  8. python简单爬虫程序分析_[Python专题学习]-python开发简单爬虫

    掌握开发轻量级爬虫,这里的案例是不需要登录的静态网页抓取.涉及爬虫简介.简单爬虫架构.URL管理器.网页下载器(urllib2).网页解析器(BeautifulSoup) 一.爬虫简介以及爬虫的技术价 ...

  9. python简单爬虫课题_VS2019python爬虫入门

    VS2019新建python项目 在vs2019中添加python编译环境 创建python控制台应用程序项目 配置python环境 安装requests第三方库 管理程序包,执行安装requests ...

最新文章

  1. [BUUCTF-pwn]——jarvisoj_fm
  2. [蓝桥杯2019初赛]不同子串-substr,模拟
  3. PE 头文件 IMAGE_NT_HEADER
  4. jmeter修改redis_jmeter如何访问redis服务缓存
  5. linux基础磁盘管理,Linux基础入门-文件系统操作与磁盘管理
  6. steam夏日促销悄然开始,用Python爬取排行榜上的游戏打折信息
  7. jaxp与dom4j遍历xml树
  8. AD14简明使用教程(同样试用于手工制板)
  9. java怎么求平方怎么求指数?
  10. 5.6.3 分组总计查询
  11. 用JS输出菱形图案:
  12. 如何快速提升网站关键词排名?
  13. excel怎么拆分成多个独立表格文件
  14. Day11(重写,多态,final,抽象类)
  15. C语言C++编程学习:排序原理分析
  16. 一个很好的机会股票的价格是向南移动
  17. 新型威胁分析与防范研究
  18. 印钞一万亿焉知祸福?
  19. 撤销正在审核的和已经通过审核的app
  20. python培训班结业证书

热门文章

  1. 论文精度 —— 2018 CVPR《Generative Image Inpainting with Contextual Attention》
  2. 如何剪辑视频,视频画中画制作教程分享
  3. 《嵌入式 - Lwip开发指南》第3章 移植LWIP(无系统)
  4. stc单片机如何用C程序将IO口设为强推挽输出
  5. 读HTTP权威指南的体会
  6. 2022-2028全球与中国WiFi拦截器市场现状及未来发展趋势
  7. 阿里国际站运营的核心指标是什么?
  8. 盘点 35 个 Apache 顶级项目,我拜服了…
  9. Docplex入门(1)——线性规划
  10. 挑战杯一次出乎意料的比赛