自从报名了 2024 年 12 月的 JLPT N1 考试,我就准备着手开始了解这个考试,然后制定一些计划后就能好好开始复习了。(如果一切顺利的话)
首先想到的是需要复习一下词汇以应对考试,很快一个朴素的问题摆在了我的面前,如果要通过日本语能力测试到底需要掌握多少词汇量呢?或者说市面上出版的那些针对 JLPT 的单词书也好、网上能找到的单词卡组也好,它们的数据是从哪来的呢?
2010 年之后官方没有公开出题基准
于是我决定去 JLPT 的官网寻找答案,就像访问其他网站一样,首先我选择去官网的 FAQ 读一读。在读完所有的常见问题和解答之后,有一条问答成功吸引了我的注意。
引用:常见问题 | 日本语能力测试 JLPT
Q2010年修订考试以后,《出题标准》变为非公开了,这是为什么? A
如果是以前的我大概就得出了既然官方没有公布词汇表,那选择市面上随便哪本词汇书或是找到网上质量最优的卡组来背就行了。
过去公开的日本语能力测试出题基准
但这次我又不赶时间,抱着学习研究这个考试本身的态度我开始思考,2010 年修订考试以后变为非公开了,也就是说 2010 年之前一直是公开的,而且再加上下面这条问答表明,如果之前通过旧 JLPT 1 级的人应该也具备通过 N1 的能力,所以如果我们能找到之前的出题基准对于我们通过现行的考试肯定也是很有帮助的。
引用:常见问题 | 日本语能力测试 JLPT
Q日本语能力测试在2010年修订时,题目的形式有所变更,也追加了新的题型。那么,现在的考试等级与旧考试的等级是如何对应的呢? A现在的考试,根据统计分析的结果,合格与否判定标准(合格线)的设定与旧考试基本相同。因此,具有能够在旧考试的1级、2级、3级、4级中合格的日语能力的考生,也可以理解为具有分别在现在的考试N1、N2、N4、N5中合格的日语能力。至于2010年新实施的N3,是对旧考试的2级和3级的合格判定标准的日语能力等级进行统计学分析,将N3的合格分设定在二者之间的。
于是通过一番搜索,之前确实出版过一本叫作『日本語能力試験出題基準』的书。这本书最早出版于 1994 年,最新的修订版也是 2007 年的事情了,目前已经绝版。我找遍了整个网络也没有找到这本书的内容,不过好在我在日本,我可以去图书馆借,或者运气好的话可以买到二手的。不过如果你不在日本,也不要灰心,尽管读不到这本书的原文,但还是有好心人(似乎是一个之前在台湾教日语的教授)让他的学生们整理了这份目前可能是质量最高的旧 JLPT 的词汇表,似乎也是网上很多给单词分 JLPT 级别的数据来源。
新日本语能力测试出题基准是存在的
再回到本文最早引用的那条问答,除了表明之前的确是有公开的出题标准,另外还透了出一个很重要的情报,那就是现行的 2010 年之后修订的考试也是有出题基准的,只是不公开而已。这也很好理解,毕竟作为出题的一方,总不能闭着眼睛随便出吧,倒不如说出题的一方可能更依赖于这样的一个基准。而如果我们能知道考试官方是如何制定出题标准的话,对于我们准备考试岂不是很有利?
很庆幸我在找资料的时候是在 JLPT 的日文官网寻找的,虽然我上面引用的是中文官网的资料,实际上我是先读的日文网站,然后去中文官网寻找对应的翻译,这样我也不用多此一举自己翻译了。尽管 JLPT 官方网站的本地化做得很不错,但还是有一些资料是只有日文官网才有而其他语言官网是没有的。回想起我之前读侦探小说的经历,答案往往就藏在一些小的细节里。比如只有日文官网刊载了与 JLPT 相关的一些论文和记事。
其中有一篇叫作「新しい日本語能力試験のための語彙表作成に向けて」的论文介绍了官方是如何为了 2010 年修订的考试的词汇部分而作准备的。里面详细描述了词汇表的制作过程,虽然没有公布词汇表本身,但我感觉了解制作词汇表的过程似乎对于我来说更有意思。而通过这篇文章,我们更可以肯定内部的出题基准是存在的只是不公开而已。
新日本语能力测试的词汇表是怎么制定的?
选词的方针
通过阅读论文,首先得知了词汇表制作的方针。我感觉有了这个方针,不仅是 JLPT 官方,而且作为日语学习者如果想制作属于自己的单词卡组来扩展词汇量也是一个不错参考。
新词汇表的词汇来源
所谓巧妇难为无米之炊,站在出题方的角度来看,首先要确立的就是从哪里选择词汇比较合适呢?他们很大方地列出了选词数据库。内容如下:
引用:押尾和美・秋元美晴・武田明子・阿部洋子・高梨美穂・柳澤好昭・岩元隆一・石毛順子(2008)「新しい日本語能力試験のための語彙表作成に向けて」
词汇的选择方法
有了词汇的来源,只要再有一个选词的方法,之后就可以按部就班开展工作了,从论文中看来他们的做法我自己总结一下大概是:
- 先处理数据量较小的外来语和拟声拟态词,筛选出 1602 个外来语,346 个拟声拟态词
- 在词频最高的 30000 个单词(主要是书面语)中通过第一轮筛选出 16769 个词语(第一次数据库)
- 把第一次数据库的词语加上率先整理出的外来语和拟声拟态词,配合上已有的出题基准的词汇表,去除重复再进一步筛选后得到 15703 个词语(第二次数据库)
- 然后在第二次数据库的基础上加上一些特有的口语表现就得到了几乎是最后的第三次数据库。
最终的词汇量
截至那篇论文发表时,他们正在第三次数据库的基础上进一步筛选和给单词定级,之后的事情似乎就没有公开情报了。而最后的单词量在论文写完的时间点还在讨论中,虽说他们给的结论大概是 10000 到 18000 之间。不过论文有谈到之前公开的词汇表各个等级的词汇量,如果新的 N1 词汇表过大的话,对于考生也是不小的负担,另一方面也谈到了实际指导留学生的教师的意见,觉得对于留学生而言 10000 的词汇量还是少了点。
旧日本语能力测试等级 | 词汇量 |
1 级(N1) | 8009 |
2 级(N2) | 5035 |
3 级(N4) | 1409 |
4 级(N5) | 728 |
我个人推测,如果把第二次数据库的 15000 左右的数量和旧的出题基准里 1 级要求的数量比较,那确实一下子有点过多了,但是如果 10000 又太少的话,最终折衷在 12000 到 13000 之间比较合理?
总结
通过这次顺藤摸瓜式的对 JLPT 出题词汇表的调查,我感觉这比准备考试本身有意思多了。
回到本文的主题,日本语能力测试 JLPT 的词汇表是从哪来的?不难想象在官方没有公开现行出题基准的前提下,我能想到的各种词汇书或是网上的卡组的来源大概是:
- 以旧的出题基准为蓝本,然后把旧 2 级的词汇分一些给 N3,最后加上一些补充的词汇
- 通过和官方类似的手法,通过词频等来源决定一个词语的去留,最后筛选出一定量的词汇
评论
参考这个就可以了:
https://jhlee.sakura.ne.jp/JEV/
厉害了,像大佬学习。