深圳市福田区东海花园一期一栋6E
(0755) 2846 9670

科普博文

橘逾淮为枳:

AR / STAR 成绩系统性虚高对中国原版娃造成的深远影响

AR 阅读计划 (Accelerated Reader) 和 STAR 阅读水平标准化测试 (Standardized Test for the Assessment of Reading),是美国 Renaissance 公司针对美国中小学英语教师设计的教学支援软件。

Renaissance 公司创办者 Judi Paul 是一名拥有小学教育本科学位的家庭主妇。她虽从未担任正式教职,但这方面的专业知识使她在教育自己的孩子时,能够采用各种创新和系统的方法。

Terry 和 Judi Paul

为了鼓励自己三个女儿和一个儿子积极阅读,Judi 于1984年开发了一套奖励和检测机制。她根据难易程度为家里每一本书都设定了积分,让孩子们自由选择。孩子看完自己选择的书之后,需要做一个小测验,合格便可获取相应的积分。孩子拥有一定的积分后,就可以换取奖励。

Judi 的丈夫 Terry Paul,是一位成功的律师和商人。看到 Judi 引导子女阅读的良好效果,觉得这是一个值得推广的产品。在他的鼓励下,Judi 于 1986 年注册了一间公司,根据自己的教学理念,开发出供英语老师使用的 AR 阅读支援系统,向学校推广。

Judi 和 Terry Paul 的四个孩子

AR 系统分为三个部分。首先,Judi 开发了一个叫 ATOS (Advantage - TASA Open Standard) 的文本分析软件,自动根据文字的难易和长短,为书籍分类打分。越难越长的书,学生读完后可获得的分数越高。

第二个部分是一套电脑测验题库,为近 200,000 本书提供测试支援。学生在看完书之后,只要通过测试,就可以获得那本书的积分。老师可让达到一定积分的学生,换取各种奖品,鼓励阅读。

第三个部分是 TOPS 报告 (The Opportunity to Praise Students) 。老师可以随时让电脑根据学生看完书之后的测试结果,生成详细的报告,帮助老师监督孩子的阅读进程,并在适当的时候给予赞赏和鼓励。

Accelerated Reader 的推广卖点

1994 年,Terry 任 CEO 的商业电脑备份系统公司 Best Power Technology 被收购,他全职加入 Renaissance,并于1996年推出第一代 STAR 测试系统。通过当时最新的计算机自适应测试理念,用较短的时间测试学生的阅读能力,供老师为个别学生制定阅读计划时参考。

到了2011年,STAR 测试系统已经发展到了第三代。测试内容从传统的只有词汇含义一项,改为 Item Response Theory (IRT) 的25项不同方面的能力测试,准确度、稳定度和误差都有了显著的改善。

STAR 的推广卖点

Terry 长袖善舞,成功说服了不少学校把 AR 和 STAR 作为申请州和联邦政府教育拨款的项目。由于刚好赶上了美国教育标准化的大潮,AR 和 STAR 十几年间就成为了美国最多学校选用的阅读支援系统,也在各大媒体和学术期刊上引发多次激烈争议,火花四溅。

不要用 AR 的18个理由

这场论战从 90 年代一直持续到今天,仍未有定论。 Renaissance 公司虽然号称 AR 和 STAR 有大量科研支持,但有不少知名语言和教育学家(如南加州大学的克拉申,奥尔巴尼大学的 Joette Stefl-Mabry),都对这些科研的可信度提出质疑。加上不少证明 AR 和 STAR 有效的研究人员跟 Renaissance 公司之间存在着各种直接和间接的关系,他们作出的科研设置和提供的数据往往都耐人寻味,更令事情进一步复杂化。知名的独立研究人员很少能够发现 AR 和 STAR 能大幅提升学生阅读能力的强烈证据,顶多只能找到对低年级学生有少许帮助的迹象。

美国教育部教育科学研究所辖下 What Works Clearinghouse (WWC) 2016 年发表的官方报告中,审核了71份 AR 有效性的科研报告。其中 60 份被认定水平过低,9 份被认为研究设置未达到标准,仅有两份达到 WWC 对科研要求的设置标准和水平。从这两份科研报告中, WWC 认定有证据显示 AR 对学生阅读理解能力有少量的正面作用,但也有一定的负面作用。对学生阅读流畅度则没有任何能被察觉到的影响。

What Works Clearinghouse 2016年针对 AR 发表的官方报告结论

众多反对意见之中,STAR 测试的可靠程度以及 AR 对学生的阅读引导方向是最引人诟病的两个部分。即使是支持 AR / STAR 的老师,也都强调自己只把测试结果作为参考数据之一,绝不全盘信赖,并且会自行调整引导学生阅读的方向,避免依赖 AR 的各种不良后果。

AR / STAR 系统是针对美国本土一般孩子开发,评估成绩对英语非母语学生并不适用。美国学校的专业 ESL 老师,一般不会为英语非母语学生选用这套系统。 Renaissance 公司为了怕引起误会,更在提供给老师的 STAR 测试系统技术指南中,特意强调如果老师为英语非母语学生或部分特殊儿童测试时提供额外时间,需要注意在这种情况下测试出的成绩是末经调整,不能作准的。

Extended time may be a valuable accommodation for English language learners as well as for some students with disabilities. Test users who elect the extended time limit for their students should be aware that STAR Reading norms, as well as other technical data such as reliability and validity , are based on test administration using the standard time limits. When the extended time limit accommodation is elected, students have three times longer than the standard time limits to answer each question.

可是使用 AR / STAR 系统的中国家长,一般都是通过网上推广资讯和口耳相传了解这套系统,很少有机会接触具体的技术指南。以讹传讹之下,AR 和 STAR 自越洋来到中国后反而摇身一变,成为不少原版家长们完全信赖的权威系统。

中国孩子每天原版看得再多,也会跟美国孩子有一定的差距。阅读能力如果达到接近同龄美国孩子的水平,已经十分难得。超出一、两年的,更是凤毛麟角。但由于 AR / STAR 测试中国原版娃时,系统往往会把时间限制大幅放松,设置成三倍于美国孩子,造成大量原版娃测试后都能取得「超英越美」两三年的虚高成绩,诱使众多家长陷入狂热之中。不少家长如果孩子测试出的阅读水平「只」超越美国同龄孩子一两年,竟已会感到挫折。

在有心人的推波助澜之下,AR / STAR 成绩「放卫星」一波比一波严重,到了后期,甚至有博主宣扬一年级已达「AR 9.1」的荒唐案例,害惨了不少优秀的孩子。

STAR 成绩虚高已经达到「亩产万斤」的程度

原版英语本是一件非常美好的事情,每一个家长都可以根据孩子的具体需要,循序渐进、自然地帮孩子打好英语基础。不仅为孩子免去学习外语最难阶段的各种辛苦,更能加强亲子关系,建立一段美好温馨的回忆。

但若家长被虚高的 AR / STAR 成绩误导,不理孩子的实际情况,盲目根据电脑测试结果为孩子选择超前读物,只会把一件赏心乐事变成艰苦万分。导致孩子学得越来越辛苦,进步越来越慢,越来越抗拒英语。在这种情况下家长如仍不知难而退,改为选择适合孩子的读物,反而坚持继续攻关,很容易令孩子迷失方向,卡在超前教育的牛角尖里面,「云横秦岭家何在?雪拥蓝关马不前」。

过去两年间,有不少天资优秀、积极进取的原版娃,因学习进展开始停滞,希望寻求专业老师的教导而来到拔萃。本来只要为他们提供适合的材料和良好的引导,这些孩子都能够在英语学习的路上走得特别快、特别远。不幸部分家长在孩子虚高 AR / STAR 成绩的影响下,已无法接受专业老师的客观意见,拒绝老师根据孩子的实际能力选择的适合教材,坚持要求超前再超前。

拔萃是一间营利教学机构,家长提出的要求但凡有半点可行性,我们肯定尽力而为。可是我们无法为了迎合家长,要求老师制作明知对孩子有害的教学方案。即使我们真的愿意提出这种要求,任何具有专业责任心的老师也一样会断然拒绝。所以最终只好承受流失这批高影响力学生/家长的无奈后果。

AR / STAR 系统是针对美国本土一般学生设置。美国学生加时测评的结果已经意义不大,对中国优秀原版娃更是没有参考价值。如果家长希望掌握孩子英语能力的进度,即使没有专业老师,单靠自己也能做得远比 AR / STAR 系统准确。

原版英语本是一件非常美好的事情

家长可以根据学生程度,挑几份学生从没看过、不同程度的分级读物,每份选出一段几十到几百字的部分进行测试。

在测试之前,家长应该先查完词典,自己完全弄清文章意思之后,让孩子朗读一遍,并用电脑或其他工具录制下来。读完之后让孩子用中文解释一遍大概意思,然后再对照原版音频,统计念错了多少、自我纠正的频率、念的速度快慢,以及理解有多少错误。

如果只有一两个错误,阅读流畅,没有经常停顿,对文章的理解基本正确,孩子又不觉得难,就可以视为孩子完成了这个级别

这样测试的结果会远比 AR / STAR 全面和真实,家长才能为孩子挑选到适合的读物。

孩子年纪小,理解能力、专注度有限,如果超负荷安排学习计划,孩子就会产生逆反、排斥心理,不仅学不好,还会产生厌学情绪,结果会适得其反。即使貌似孩子学会了,也容易造成一些知识掌握浮于表面、不求甚解,这样的学习习惯也不利于孩子以后的发展。

超前教育是令孩子落后最有效的方法!