你好,我是海明。
我想知道学好英语需要多少单词量,所以我研究了二语习得领域当中100多页的顶级论文。
这里面的研究素材包括:
- 320部电影
- 288集美剧
- 200多篇报纸文章
- 400场演讲
- 1000多首流行歌曲
- 10 部小说
- 1份长度为20万单词的口语素材
以及很多个在英语国家接受硕士或者博士以上教育的人,他们的单词量数据,他们都不是英语母语者,这其中还包括牛津大学、剑桥大学的研究。
牛津大学 - Oxford University
在开始讲结论之前,我要先说一下这些研究所使用的统计原则,也就是他们是怎样统计这些单词量的,之后我会公布结论,最后我还会告诉你,怎样利用这些研究的数据去提升英语水平,这三部分都是环环相扣的。
01
单词量统计的原则
单词量统计主要有4个原则。
第1个原则就是词族里面的单词算1个,词族的意思就是变形、派生这些,我举一些例子你就明白了:
1)动词run,跑步,它有以下几种形态:
- 原型:run
- 第三人称单数:runs
- 过去式:ran
- 现在分词(即ing形式):running
- 名词:runner(跑步者)
这里面有5个单词,但是在统计的时候只按照1个来算。
2)hot(热的)dog(狗) hot dog(热狗)这里面算多少个单词呢?统计的时候是算2个,也就是只算hot和dog,因为当你理解了这两个单词之后,你再去学习hot dog是很容易的。
3)其它的例子比如说形容词good,它的比较级better,还有它的最高级best,在统计的时候,这3个单词只算1个,所以单词量都是按照这种方法统计出来的
至于更具体的细节我们就不需要关注太多了,那些都是语言学家的事情,我们只需要知道这个原则就ok了。
第2个原则就是计算的时候排除专有名词,专有名词就是那些只有1种意思的人或者物,类似人名、地名这种,比如说你在看哈利波特的时候,主角的名字Harry Potter就是专有名词
哈利波特 - Harry Potter
这些专有名词是很容易学习理解的,所以统计的时候是不计算在内的。
第3个原则就是这些词汇都是被动词汇,被动词汇的意思就是你只能在阅读还有听力当中理解,但是你在口语或者说写作当中,就使用不出来的那种。
说白了你能听懂看懂,但是你说不出来写不出来。
其实被动词汇的数量才是最重要的,因为我们可以用相对比较少的单词去进行口语表达,但是要理解别人,就是需要比较大的单词量。
同时这里所说的理解,是在真实的听力、阅读中理解,如果你只是认识单词的中文意思,是远远不够的。
因为在真实的语境中,单词还包含发音、语速、连读弱读,甚至是情绪、色彩和隐喻等等,只有在真实的语境中理解了,才算真的理解。
第4个原则就是词汇覆盖率要达到98%以上,词汇覆盖率的意思就是把文本中那些重复的单词,还有专有名词排除掉之后,剩下的那些词汇,我们要理解98%以上,换一种说法就是,100个单词当中我们要理解98个。
这种情况之下,由于人脑会自动理解剩下的2%的内容,就等于理解了全部的内容。
所以在理解了文本的98%以上之后,研究者就可以认定你是完全理解内容的,其实这已经是一个很严格的要求了。
有些学者也指出,在真实情况之下,其实未必需要到达98%以上的理解度,某些情况下理解95%已经足够了,甚至在一些场景下90%的理解度也是可以接受的。
理解98% = 完全理解
但是为了保险起见,并且让学习者真正有效的吸收英语,还是按照98%来算吧。
注意哦,100个单词认识其中的98个,是假设你已经认识了其中的专有名词、语法、用法、短语等等
还有比如说在听力当中,是假设你已经理解了正常情况下的那种语速、口音,连读、弱读等等,这才算是真真正正的理解。
所以这些研究的结论就是基于以上4个统计原则,计算出来的单词量需求。
02
口语素材
我们先说一下口语素材的单词量要求。
1)听懂电影
牛津大学2009年的一篇文章指出,只需要6000的单词量,我们就可以理解电影当中的98.15%的内容,而只需要3000的单词量,我们就可以理解电影当中的95.76%的内容。
这个实验研究了318部英语电影,总时长为601小时33分钟,这些电影包括十几种类型,同时文章也指出了美国电影使用的单词量,平均来说要比英国电影少1000个。
说白了就是,美国的电影用词比较简单,比较口语化。
这里还有一点值得注意的就是,不同类型的电影所需要的单词量,有很大的差异,但是平均来说,我们只需要6000个单词,就可以理解电影的内容了。