作为一名19考研er

距离我考研结束已经过去大半年

想和大家分享一下当初背单词的骚操作

众所周知

考研英语“得阅读者得天下”

提升词汇量又是提高阅读的关键

那么问题来了?

大家都是怎么背单词的呢

从A到Z拿起砖头书就开干

abandon abandon 放弃... ...

又或是拿起《考研大纲词汇5500》

背了前面忘了后面

也不能说不对...

只是考研时间争分夺秒

这样 太慢了!

还有一个问题

你背的单词你确定它考吗?

你考研大纲5500有多少零频词你知道吗?

一个生词死磕半天

却发现他从来没在真题中出现过

难受吧

既然要应试

就要有应试该有都样子

考研阅读如此重要

那最快得办法就是直接背阅读里的单词

背阅读里的中高频词

”啥?“

”我一篇阅读都还没做过现在直接拿起阅读看”

“到时候做起真题岂不是被剧透一脸!”

不不不,还没说完

下面就来教你怎么高效的背阅读里的单词

首先我设想的程序是这样的

输入:历年的阅读真题

输出:考研真题词频降序表

啥是词频降序表我先解释一下

如图,左边是历年真题出现单词

右边是此单词的频数,也就是出现的次数

整张表对出现次数降序排列下来

就叫作词频降序表

程序的设计思路是这样的

(看不懂就直接跳过这里吧,文末可直接获取词频表)

先下载好历年的真题

然后我挑选了其中的阅读和完形部分

统一整理成一份txt格式的英文文本数据

数据准备好了

接下来开始编写程序

我采用python常用的自然语言处理包

NTLK(Natural Language Toolkit)

在控制台使用pip install nltk命令安装NLTK库

执行如下python语句下载语料库

界面弹出包管理界面

选择all然后Download就行

准备工作完毕就可以正式的编写代码

首先用正则表达式切分特殊字符

比如逗号、分号、冒号等

pat_letter = re.compile(r'[^a-zA-Z \']+')

还有特殊的缩写单词

比如

can't ---> can not

I've--->I have

...

同样编写它们的正则规则

紧接着对文本进行分词操作

# 分词处理words = nltk.word_tokenize(text)

再对无意义的停用词和初级词汇进行过滤

停用词可以理解为无实意的虚词,如of、is等

(NLTK英文停用词库)

初级词汇就是apple、hello这种,都是需要剔除的

剔除的依据采用BNC采用词汇

我们从中进行挑选出部分初级词汇进行过滤

(BNC常用词汇表)

将停用词表和初级词汇表整合成一个过滤词表

用if语句将属于过滤词表的单词通通过滤掉

下一步,词形还原

gril,grils这种同一个词只是形式不同

我们都需要在保持词性不变的前提下对这些词进行还原

阅读的词汇处理干净后

就要对词语进行词频的统计和排序

直接使用python提供的collections.Counter()模块

对集合元素进行统计

 # 返回单词和词频 并排序collections.Counter(words).most_common()

最后导出成CSV格式

就得到了我们想要的词频降序表

对词频表进行初步分析

我们可以发现

有2013个单词

只出现一次!

而真正考研反复出现的单词

仅仅只有两千多个

我们只要按照频率从高往低背

就可以率先解决阅读中的大部分生词

那么问题又来了

难道以后背单词都要对着excel背吗

没有中文、没有例句、没有发音?

打死我也不会去用的

误会了

到这里还没结束

用过墨墨背单词的一定知道

有一个功能是添加自定义词库

进去后的界面如下

复制词汇表的第一列单词

然后粘贴进来

保存后即可生成自定义的单词本

墨墨背单词提供了单词的

发音、翻译、例句、记忆方法等功能

并且能够根据艾宾浩斯曲线安排复习计划

将词频降序表与墨墨背单词结合一起

从此考研词汇就再也没有看不懂的了

从最高频的词汇开始背起

抢先抓住阅读的核心词汇

背的每一个单词你都知道他在文章中出现了N次

意味着每背一个单词

将来你都少错N次

视频教程在这

公众号发送考研单词

即可获得考研词汇表

python 对excel文件进行分词并进行词频统计_教你背单词 | 利用python分析考研英语阅读并生成词频降序表...相关推荐

  1. python 词表里的词不符合_教你背单词 | 利用python分析考研英语阅读并生成词频降序表...

    作为一名19考研er 距离我考研结束已经过去大半年 想和大家分享一下当初背单词的骚操作 众所周知 考研英语"得阅读者得天下" 提升词汇量又是提高阅读的关键 那么问题来了? 大家都是 ...

  2. 如何用python开发一个贪吃蛇游戏_教你一步步利用python实现贪吃蛇游戏

    教你一步步利用python实现贪吃蛇游戏 来源:中文源码网    浏览: 次    日期:2019年11月5日 [下载文档:  教你一步步利用python实现贪吃蛇游戏.txt ] (友情提示:右键点 ...

  3. python 对excel文件进行分词并进行词频统计_python 词频分析

    python词频分析 昨天看到几行关于用 python 进行词频分析的代码,深刻感受到了 python 的强大之处.(尤其是最近自己为了在学习 c 语言感觉被它的语法都快搞炸了,python 从来没有 ...

  4. python输入一个数组输出24进制式的时间_【翻译】《利用Python进行数据分析·第2版》第4章(下)NumPy基础:数组和矢量计算...

    前文传送门: 4.3 利用数组进行数据处理 NumPy数组使你可以将许多种数据处理任务表述为简洁的数组表达式(否则需要编写循环).用数组表达式代替循环的做法,通常被称为矢量化.一般来说,矢量化数组运算 ...

  5. python 读取excel文件 效率 时间 格式_python读取Excel文件中的时间数据

    在使用python读取Excel文件中的时间格式,碰到的时间格式转换问题: 读取这样的表格: 输出这样的数据结果: 然而这样的结果却不是我们想要的,我们需要的是这样的结果: 1.安装python官方库 ...

  6. python处理excel文件的模块_python处理Excel文件的几个模块

    在python中简单地处理excel文件,有几个相关的模块,各有千秋,本文将不定时收录. Python Excel网站收集了关于python处理excel文件的各种信息. [注意]使用python处理 ...

  7. 怎么用python处理excel文件-用python处理excel文件有多轻松?工作从未如此简单

    最近需要频繁读写 excel 文件,想通过程序对 excel 文件进行自动化处理,发现使用 python 的 openpyxl 库进行 excel 文件读写实在太方便了,结构清晰,操作简单.本文对 o ...

  8. python处理excel教程实例-python 读写excel文件操作示例【附源码下载】

    本文实例讲述了python 读写excel文件操作.分享给大家供大家参考,具体如下: 对excel文件的操作,python有第三方的工具包支持,xlutils,在这个工具包中包含了xlrd,xlwt等 ...

  9. python处理excel表格实例-使用Python操作excel文件的实例代码

    使用的类库 pip install openpyxl 操作实现 •工作簿操作 # coding: utf-8 from openpyxl import Workbook # 创建一个excel工作簿 ...

最新文章

  1. linux下aio异步读写详解与实例
  2. python3 redis_python3_redis随手学习笔记
  3. web前端网页设计作业_网页前端设计快速入门技巧
  4. 高考成绩查询接口(转)
  5. java零碎要点---class()、getClass()、Class.forName()、getClassLoader()的区别和联系--又不详细的地方求补充
  6. nsurl转nsdata_ios 中NSData 拼接成功,但写入本地种只有前面的data
  7. React 16 源码解析笔记 02 - JSX 转换为 ReactElement 的过程
  8. dmp(数据管理平台)是什么?
  9. python常用数学公式
  10. 离散数学中Warshall算法简析
  11. Linux 命令系统性学习
  12. python 利用random生成验证码与MD5码加密过程
  13. 在线计算机长度,长度单位在线换算器
  14. 跨局域网远程连接神器——frp内网穿透
  15. VUE 学习之parent 选项
  16. 团队协作三、OnlyOffice 实现文件在线预览和编辑
  17. 计算机调剂还是找工作,儿子是C9学生,考研只能调剂,究竟是调剂好还是找工作好?...
  18. 计算机集中控制系统结构上和DCS基本一致,DCS工作原理及组成ppt课件
  19. 上传了ipa但iTunes Connect没有构建版本问题
  20. 在Ubuntu上安装配置 Gitlab -- 下载程序包后快速安装部署

热门文章

  1. python中的字符串是什么,一文秒懂Python中的字符串
  2. python3堆排序_python 堆排序
  3. python基础入门: for 循环
  4. Python列表解析式,还支持异步?你知道吗?
  5. Python字典中setdefault和update用法区别
  6. Python定义函数的三种方式
  7. Python找出列表中出现次数最多的元素三种方式
  8. Python的运算符和编码
  9. Python 常见优化技巧,让你的程序溜溜的跑起来!
  10. Python中最常用的字符串方法!