最近朋友在苦学英文,但是又不知道自己学的怎么样了,直到有一天,他找到了扇贝网,里面有个“评估你的单词量”功能非常的好,就推荐给我了!

今天我们就用python做一个小的爬虫,然后自己写一个脚本来实现这个功能吧!

目标:打造一个英文词汇量测试脚本

url:扇贝网

工具:python3.6、pycharm、requests库

思路:

和网页一样,总共分三步:

先来看看网页中数据,用F12开发者工具抓包就可以

为了更好的演示,这里网页缩小了。

点击开始,在来看看出现了什么

这里我们抓到了一个包,这个json数据中包含了所有的类别或者说是级别,一共十大类,我们点击”响应”验证下

可以看到,显示内容在我们抓到的json数据中,但是0和1中的内容有的一样,有的不一样是什么鬼?不要急,我们先选择‘高考’,在抓下包看看

选择高考后,网页直接给出了第二步,50个单词选择,注意,先看下抓到的json数据的真实地址

还记得我们在第一步抓到的包吗?0里面就是这个真实地址最后的category的值,1里面是对应的显示在网页中的内容,好了,第二步的真实url也被我们找到规律了,那下来就是分析单词了,看看有什么规律,我们点开一个看看

有几个值非常重要,也是我们的目标:

Content的值是显示的单词

Definition_choices是需要我们判断的多个词义,中间包含有正确的词义,每个词义中的rank值应该是该词义的标识

rank值是正确的词义,也由此判断上述多个词义中的正确词义

ok,到这里我们就可以开始写代码了,具体过程就不一一说明了,没有反爬,全部是json数据的读取和判断,先放上我的代码和运行效果

请大家忽略我那渣渣的英语水平和排版吧视频内容

由于这个网站非常简单,仅仅抓包就可以得到所有数据,没有任何反爬,所以,也是我们新手练手的好地方,大家都可以试试,如果有作出更漂亮的脚本,欢迎大家在评论区一起分享!

python爬虫英文单词_非常适合新手的一个Python爬虫项目:打造一个英文词汇量测试脚本...相关推荐

  1. 学python要有多少英语词汇量测试_非常适合新手的一个Python爬虫项目: 打造一个英文词汇量测试脚本!...

    最近朋友在苦学英文,但是又不知道自己学的怎么样了,直到有一天,他找到了扇贝网,里面有个"评估你的单词量"功能非常的好,就推荐给我了! 今天我们就用python做一个小的爬虫,然后自 ...

  2. python英语词汇量测试_非常适合新手的一个Python爬虫项目: 打造一个英文词汇量测试脚本!...

    最近朋友在苦学英文,但是又不知道自己学的怎么样了,直到有一天,他找到了扇贝网,里面有个"评估你的单词量"功能非常的好,就推荐给我了! 今天我们就用python做一个小的爬虫,然后自 ...

  3. 非常适合新手的一个Python爬虫项目: 打造一个英文词汇量测试脚本!

    最近朋友在苦学英文,但是又不知道自己学的怎么样了,直到有一天,他找到了扇贝网,里面有个"评估你的单词量"功能非常的好,就推荐给我了! 今天我们就用python做一个小的爬虫,然后自 ...

  4. python难不难学-超级适合新手学习的python教程,入门其实不难?

    在互联网时代很多人都希望掌握一个与互联网相关的知识,比如Python的知识就非常重要,因为无论是操作新媒体平台还是去制作一些软件,我们都需要掌握一些Python的技巧,而且学习一些Python的知识, ...

  5. python新手练习项目_最适合新手练习的Python小项目!还是有难度的!用了五天整理...

    要想实现web服务器,首先要明白web服务器应该具备怎样的功能:比如说浏览器发送了http请求(GET或POST),服务器要首先接收客户端发送的TCP请求,与之建立链接,然后接收http请求,解析并响 ...

  6. python大游戏_玩游戏就能学Python?太炫酷了!

    原标题:玩游戏就能学Python?太炫酷了! 要说现在最火的语言,那一定是Python了. 各种排行榜里,Python的排名都是蹭蹭蹭地往上涨.Python也确实是最适合新手入门的语言了,语法简单,应 ...

  7. 有哪些适合新手练手的前端项目?

    学习编程专栏连载编程新手练手项目系列之前端项目篇,同样也欢迎热爱学习.对Java感兴趣的朋友学习翻阅上三两篇内容.(连载系列的项目整理以后会在每个月进行一次重新整理,也欢迎大家进行项目的投稿,投稿请私 ...

  8. 一个特别适合新手练习的Android小项目——每日一妹纸

    原文链接 http://sparkyuan.me/ 转载请注明出处 介绍 当前版本V 1.2 刚开始学习Android的时候,主要就是学习了一些Activity的生命周期,各种View和Layout的 ...

  9. java技术分享主题_Java开发入门:适合新手练手的Java项目(附源码下载)

    Java作为一门古老的语言,已有20年左右的历史,这在发展日新月异的技术圈可以说是一个神话.虽然不少人曾抱怨Java语言就像老太太的裹脚布,又臭又长,有时写了500行都不能表达程序员的意图. 但从市场 ...

最新文章

  1. 当自动驾驶汽车撞过来的时候,你希望它如何判断?
  2. 从源码分析DEARGUI之add_listbox
  3. 1077: 字符串加密
  4. php鼠标经过显示文本,jQuery实现鼠标单击网页文字后在文本框显示的方法
  5. 具有OpenCV和相似度测量的视频输入
  6. How SAP concrete schema id is got based on transaction type plus catalog type
  7. netflix_Netflix播放按钮剖析
  8. 实时获取滚动条的高度_适用于星上快速处理的雷达高度计有效波高反演技术
  9. Dynamic Routing-中科院西交旷视(孙剑团队)提出用于语义分割的动态路由网络,精确感知多尺度目标,代码已开源!...
  10. Java抽象类、接口和内部类
  11. 卧薪尝胆三千越甲可吞吴
  12. 如何通过TRAMP / Emacs远程控制nrepl-ritz-jack-in工作
  13. mysql获取当天,昨天,本周,本月,上周,上月的起始时间
  14. 包含农历、节气、节假日的前端日历
  15. 计算机boot进入u盘启动,深度u盘装系统进入boot设置教程
  16. 成都“小甜甜”:她给了男人希望,男人却被嘲笑X丝
  17. DocLocker - 文档外发控制系统
  18. 盘姬工具箱WV1.10
  19. web安全:通俗易懂,以实例讲述破解网站的原理及如何进行防护!如何让网站变得更安全。
  20. web页面播放实时视频流

热门文章

  1. gdb调试查看内存数据
  2. python分支机构_基于Python爬取天眼查网站的企业信息!Python无所不能!
  3. 使用anaconda安装opencv包
  4. 周测作业五(apache的安装与配置)
  5. SLAM十四讲ch5 joinMap错误解决
  6. python---Web前端HTML(超文本标记语言)
  7. 使用grop解析日志
  8. 华为独家承建波兰P4 UMTS网络
  9. win7硬盘分区软件_误删数据恢复软件,你应该拥有它!
  10. Lotus 新手运维手册