Derek最近捣鼓了一个学习英语的社群,纠集了一群有共同爱好的朋友一起利用闲暇的时间学习英语。通过这个学习群,Derek认识了很多很有毅力的英语学习者,于是,Derek的微信朋友圈里面多了一条另类的风景线,“背单词打卡”;现在几乎所有背单词的APP,都有分享朋友圈发送打卡信息给朋友的功能,于是,我开始每天看着很多人“我已经在XXAPP上背单词xx天了,今天已经征服了xx个单词”。一般看到这种情况,我非常喜欢给大家点个赞,因为我知道,“背单词”,绝对是一个非常苦的差事,不管你使用什么APP,这种充满了负反馈,不断挑战你耐心的学习活动,实在是值得上一个大大赞。

或许是好为人师的缘故,身边不断有朋友向Derek请教背单词的方法和技巧,企图找到一个不那么痛苦的方式。因为问的人太多,我突然觉得应该写个文章出来共同讨论下这个问题。

我首先明确一下我自己的认知,背单词虽然不是学习英语的全部,但__的的确确是英语水平提高必不可少的一个重要环节__。所以,企图从本文里找到一个捷径的同学可能要失望了,我确实拿不出一个“躺在床上就学好英语”的好办法来。因此,我并不打算在本文讨论是否需要背单词的问题,也不讨论方法问题,我打算聊聊,如果要背单词,你应该选什么词表。

实际上,本文是写给那些准备真正提升英语能力,希望通过英语能更好的了解这个世界的朋友。考试党的选择其实非常小,几乎所有的为考试准备的学习方法里面,都有一个对应的词表,需要考试的朋友可以略过了,因为你只需要关注大纲要求的词表即可。

为什么我们需要一个词表

现在,是一个移动智能终端极度发达的时代,几乎所有成人朋友在打算重拾英语的时候,都会选择使用手机APP来背单词,而所有的APP背单词软件都有几大必须存在的功能:

适合各个水平阶段的词表有对应音标带发音,例句科学的记忆曲线,方便复习

这几个功能,几乎所有的背单词APP都有,结合我们今天的主题,我们聊聊词表。

在选择开始背单词前,这几乎是你的第一个需要作出决定的事情,你选择什么样的词表来背?准备考试的朋友还好办,考啥背啥,根据大纲来,如果准备中考,就背中考词表,如果准备高考,就找找高考词表。

对成人学习者来说,这个选择就比较尴尬了,很多的成人英语学习者对自己的英文水平其实并不了解,他们掌握英语的目的是使用它,而不是应付考试。这个时候,大部分人的选择就比较盲目。上过大学的朋友,丢掉英语多年,比较可能选的词表是四级词汇或者六级词汇,没有上过的呢,很多都是从什么小学词汇,中学词汇,新概念第一、第二册开始,还有些朋友,估计是听过一些英语学习的讲座,选择了一些比较另类的词表,比如说,老友记词表,绝望主妇词表来背。

朋友们,既然是学习英语的目的是真正的使用,那么大家有没有想过:

我们学了十几年英语,每个人心中都必然有个疑问:

想要流畅轻松的读懂大部分的网页,小说,报刊,新闻等原版材料,大概需要多少词汇量?

著名网站testyourvocab历时几年,做了一个比较真实完整的调查。

调查结果如下:

绝大多数母语成年人士的词汇量为20,000–35,000words8岁的母语人士平均词汇量为10,000words4岁的母语人士平均词汇量为5,000words母语人士的词汇量大小主要是4到15岁之间的阅读量决定

令人比较丧气的结果如下:

绝大多数外语人士的词汇量仅为4,500words在英语国家居住的母语人士词汇量平均仅为10,000words

不少人看到这里肯定心存怀疑,考完专八背完托福词汇却无法流畅阅读的也大有人在,与语言学家的研究“大相径庭”。

究其原因,关键在于对__“常用词汇”__的认知。

语言学家发现的另一个有趣事实是:

英语使用频率最高的9个单词,在任何一篇100词以上的文章中出现的频率达25%!

所以,想要高效背单词,必须了解每个单词在母语使用者日常生活中出现的频率高低。

词汇量不在于你背了多少生僻单词,而在于你日常生活会用的有多少。Active vocabulary才是英语学习中最重要的部分。

问题浮出水面了,到底有没有一个词表,真正适合以实用为目的。写到这里,聪明的大伙可能已经明白了,如果要说以实用为目的,显而易见,就是根据英语词汇使用的频率统计出来的词汇表了。那么,这样的一个东西,存在吗?如果存在,它是否权威?

先给答案:存在!!!绝对存在!!权威!!!绝对权威!!!

COCA词表的介绍

COCA,全称Corpus of Contemporary American English,即当代美国英语语料库,它是这个世纪里最大的美国语言学研究项目,地位影响深远。最重要的是,它研究的对象全部都是当代美国英语语料,基本不包括20世纪早期和19世纪的语料。

COCA项目至今还没结束,目前收集了4亿词汇的文献资料。这4亿词汇的基础材料包括1990至2015年这几十年里阅读量最广泛的小说和杂志(TIME, New Yorker等都是项目的参与者),电影、电视节目,大量的电话记录和面对面谈话记录,甚至还包括911报告等)。它根据使用时间、文献性质等使用统计学方法进行分类统计,等于是在编一本带词频和流行用法的新美国英语使用辞典。

在COCA当前成果基础上,美国杨百翰大学对这个资料库用计算机方法筛选出了美语使用频率最高的5000和20000个高频词汇。曾经有人用GMAT和GRE的资料验证了一下这个词汇表的覆盖率,证明它的20000单词覆盖率真的很高,几乎全部覆盖,只有一两个很个别的词没查到。

这个词汇表最好的地方在于是每个单词不仅带词频和同义词,而且还根据不同的词性标注着collocation,也就是所谓的搭配用法。就是标出和这个词使用最相关、密度最高的词的集合。

有了它,我们就知道美国人对这个词的最常用的几十种用法和使用环境。

比如说script排3315,这个词的搭配里,常见的形容词搭配是final, original和feminine,常见的名词搭配是movie, film, writer,常见的动词搭配是write, read, follow. 所以我们知道这个词的用法就有final script, write a script等等。这个比死记硬背好太多了。

这个语料库涵盖美国现当代时期的口语(spoken)、小说(fiction)、流行杂志(pop magazine)、报纸(newspaper)和学术期刊(academic)五大类型的语料库,并且在这五个类型方面基本呈均匀平衡分布。

美国当代英语语料库的文本内容包括:

口语(spoken):包括150个电视或广播节目对话,约85000000字。小说(fiction):包括短篇故事、戏剧/电影剧本,约81000000字。杂志(popular magazines):包括新闻、健康、家庭园艺、女性话题、财经、宗教、运动等将近100种不同领域的杂志,约86000000字。报纸(newspapers):包括10家报纸不同版面(地方新闻、评论、运动、财经)的文章,约81000000字。学术期刊(academic journals):包括近100种不同种类的期刊,约81000000字。

在这个庞大的语料库中使用频率最高的20000个单词极具代表性,几乎覆盖所有权威英语考试的词表。

COCA的词表的样子

COCA的最常用20000词的词表,是一个有2000多页的文件,这份文件里面,没有词汇的解释,如下图,主要包含几个部分

词频根据词性的搭配,如前面最经常搭配什么词汇,后面经常搭配什么词汇;近义词;

189代表词频,也就是company做n(名词)时,它出现的频率在英语中是189位。后面adj代表有哪些形容词经常和company这个名词搭配。小黑点代表词的位置,比如 drug company, phone company,不要理解成company drug, company phone。至于为什么有的词有小黑点有的没有,我也没搞明白。后面的大黑点代表同义词。company做公司解释时,意思是business等,做朋友解释时,意思是companionship等,等等。后面的203345代表在4.5亿中出现的次数。0.93代表分布均匀度。越接近1代表在各种文体中分布越均匀。词频排名=次数 *均匀度。有些词的均匀度后还有个类似S,M等后缀,代表这个词主要出现在如下文体中:Spoken, Fiction, Magazines, Newspapers, Academic

如何使用COCA词表

写了这么多,终于找到一个真正按照语言实际使用情况的词表了,这就意味着,这个两万的词表拿下,就掌握了英语世界的最高频使用的词汇,这可比任何为考试准备的词表更适合成年的英语学习者了。那么,这个词表怎么使用呢?怎么才能开始使用这个词表呢?

扇贝单词APP

扇贝上面有很多热心人制作的各种词表,有些免费,部分收费,在扇贝上面就有这个COCA的20000词表,大家搜索一下应该可以看到,如下图,如果手里还有贝壳的话,大家可以购买。

自行导入

目前,有很多背单词的APP,支持词表的自行导入,你可以用一个包含了词表的纯文本文件,直接导入到软件里面背诵,据Derke所知,“知米背单词”这个APP就可以自行导入词表。只要你的词表是UTF-8格式的纯文本,都可以导入到“知米背单词”。

如何获得COCA词表,下载资源

COCA词表如果直接拿来背单词,就是上面大家看到的那样,确实难以直接使用,为了方便大家,造福群众,Derek秉承着不给解决方法只提出问题的任何干货都是耍流氓的思路,启动了我的看家本领,编程序,我从PDF文件中提取了20000所有词表,并对文件根据词性进行了分类,还体贴的分成了10000,20000,两个文件,并提供20000分词性的版本,即按动词,形容词,副词等几个大类进行了分解。做到这一步,如果你还不点赞我就真生气了,现在提供如下几个文件下载:

20000词表纯TXT版本0-10000 词表纯TXT版本10000-20000词表TXT版本20000词表分词性版COCA原版词表2200页PDF

注意:词表不包含单词解释,大部分的软件在导入词表时,会自动添加解释。

python英语单词库app_英语单词库【英语单词库英语头条】- 英语单词库知识点 - 中企动力...相关推荐

  1. python对英语的要求_对英文【对英文英语头条】- 对英文知识点 - 中企动力

    小学英语学习需要基础牢固扎实,注重语音准确到位,语法概念的循序植入,成绩一定会有质的提升! 一.语音 英语和汉语的最大差异首先就是语音的差异,单词的发音至关重要.从英文字母开始重新复习,首先对26个英 ...

  2. python对英语和数学的帮助-对英文【对英文英语头条】- 对英文知识点 - 中企动力...

    小学英语学习需要基础牢固扎实,注重语音准确到位,语法概念的循序植入,成绩一定会有质的提升! 一.语音 英语和汉语的最大差异首先就是语音的差异,单词的发音至关重要.从英文字母开始重新复习,首先对26个英 ...

  3. 导盲机器人 英语作文_中英文速记【中英文速记英语头条】- 中英文速记知识点 - 中企动力...

    I.听力应试技巧与策略 1)沉着冷静,重视试音. 正式考试前最好进行"热身".在家听英语磁带十分钟,可以使头脑中的英语思维活跃起来.不然,一进考场就考听力,许多学生会不适应.正式的 ...

  4. c语言中gets全拼,25英文【25英文英语头条】- 25英文知识点 - 中企动力

    顺口溜来学习英语,至少有三大好处: 一是节省了时间. 死记硬背效果差不说,还费时间,而利用顺口溜,效率又高又省时: 二是培养了自己的概括思维能力. 把一些词语编成顺口溜,看似容易,其实也难: 三是使人 ...

  5. unit英语读音_式读音【式读音英语头条】- 式读音知识点 - 中企动力

    我们汉语绝对是世界上独一无二的语言,不仅体现在它是几乎唯一的非线形文字. 而且也体现在其发音上.你或许想到的是汉语的四声.四声的确是汉语发音比较独特的一点. 但更独特的是汉语的音节.每个汉字严格对应一 ...

  6. piaget读法_罗读音【罗读音英语头条】- 罗读音知识点 - 中企动力

    不管你说何种语言,像这样的文章只能赞叹,不能模仿,就佩服中国老祖宗吧,不得不说中文真是华丽的变态,只用一个发音来叙述一件事,除了中文,怕是再无其他语言能做到了. 再次声明一下 每个语言都是美丽而独特的 ...

  7. c语言中a的小写字母,a小写字母【a小写字母英语头条】- a小写字母知识点 - 中企动力...

    " 第一部分:基础知识 1.字母:26个字母的大小写 ABCDEFGHIJKLMNOPQRSTUVWXYZ abcdefghijklmnopqrstuvwxyz 2.语音:元音的发音 五个元 ...

  8. python 对excel文件进行分词并进行词频统计_教你背单词 | 利用python分析考研英语阅读并生成词频降序表...

    作为一名19考研er 距离我考研结束已经过去大半年 想和大家分享一下当初背单词的骚操作 众所周知 考研英语"得阅读者得天下" 提升词汇量又是提高阅读的关键 那么问题来了? 大家都是 ...

  9. python如何拼读英语单词怎么写_怎么用英标快速拼读英语单词,这些技巧你知道吗...

    怎么用英标快速拼读英语单词?我们都知道学习英语离不开英语单词,单词是我们学习英语的基础,一个人只有积累足够多的英语单词,才能更好的去学英语.首先就要从读英标开始,那么大家知道如何用英标快速拼读单词吗? ...

  10. 牌组资源英语_「桌游推荐」如果当年有这种能背单词的桌游,我早就成英语学霸了...

    英语课上的背单词,像语文课上的背诵全文一样,是学生时代不少英语"学渣"们的噩梦,甚至现在很多人拿起英语词典还是从"abandon"开始痛苦的背单词之旅. 其实英 ...

最新文章

  1. Chrome 浏览器跨域和安全访问问题 使用 chrome的命令行标记:disable-web-security 参数联调线上数据...
  2. 远程桌面服务坏了如何修复
  3. c#读取Sybase中文乱码的解决办法
  4. java jpanel 分层显示_java – 向JPanel显示视频
  5. C# 弹出确定、取消窗口
  6. install opencv from source
  7. 【JAVA笔记——道】Hibernate 线程本地化基础篇
  8. Fiddler-弱网测试设置
  9. Python学习-第二天-字符串和常用数据结构
  10. [中文翻译] ASP.NET 5 简介(Introducing ASP.NET 5,原作ScottGu 2015/2/23)
  11. Kepware三菱驱动连接轻松开启
  12. linux vi 替换字符串,vi字符串替换命令
  13. 谈谈滞后补偿器与PI控制及其原理分析
  14. windows 安全删除硬件并弹出媒体 选项灰色、无法弹出
  15. dnssec_OPNSense上的DNSSEC,DoT和DNSBL
  16. Windows 下视频采集
  17. over partition by ... order by ...用法汇总
  18. 那些在做固态盘SSD的其实在研究这仨东西
  19. .net开发网站CMS博客框架
  20. 论文笔记:Probabilistic Matrix Factorization

热门文章

  1. java 第一 二章作业,Java私塾跟我学系列——JAVA篇 第二章 基础语法 作业
  2. javascript 实现下载的几种方法
  3. 接口测试工具 soapui 下载及安装
  4. 关于PHP自定义采集图片脚本
  5. Unity 3D ScrollView控件(滚动视图)
  6. Java设计模式pdf
  7. 计算机教室网络布线费用,办公室网络布线价格是怎么预算的
  8. 2021-10-11 CTF-KX(第一场)-RSA10
  9. android框架揭秘!Android开发者跳槽指南一线互联网公司面经总结
  10. 基于javaweb的宠物医院管理系统