香港柴灣豐業街4號志同昌工業中心2D室
2976 5639

科普博文

橘逾淮為枳:

AR / STAR 成績系統性虛高對中國原版娃造成的深遠影響

AR 閱讀計劃 (Accelerated Reader) 和 STAR 閱讀水平標準化測試 (Standardized Test for the Assessment of Reading),是美國 Renaissance 公司針對美國中小學英語教師設計的教學支援軟件。

Renaissance 公司創辦者 Judi Paul 是一名擁有小學教育本科學位的家庭主婦。她雖從未擔任正式教職,但這方面的專業知識使她在教育自己的孩子時,能夠採用各種創新和系統的方法。

Terry 和 Judi Paul

為了鼓勵自己三個女兒和一個兒子積極閱讀,Judi 於1984年開發了一套獎勵和檢測機制。她根據難易程度為家裡每一本書都設定了積分,讓孩子們自由選擇。孩子看完自己選擇的書之後,需要做一個小測驗,合格便可獲取相應的積分。孩子擁有一定的積分後,就可以換取獎勵。

Judi 的丈夫 Terry Paul,是一位成功的律師和商人。看到 Judi 引導子女閱讀的良好效果,覺得這是一個值得推廣的產品。在他的鼓勵下,Judi 於 1986 年註冊了一間公司,根據自己的教學理念,開發出供英語老師使用的 AR 閱讀支援系統,向學校推廣。

Judi 和 Terry Paul 的四個孩子

AR 系統分為三個部分。首先,Judi 開發了一個叫 ATOS (Advantage - TASA Open Standard) 的文本分析軟件,自動根據文字的難易和長短,為書籍分類打分。越難越長的書,學生讀完後可獲得的分數越高。

第二個部分是一套電腦測驗題庫,為近 200,000 本書提供測試支援。學生在看完書之後,只要通過測試,就可以獲得那本書的積分。老師可讓達到一定積分的學生,換取各種獎品,鼓勵閱讀。

第三個部分是 TOPS 報告 (The Opportunity to Praise Students) 。老師可以隨時讓電腦根據學生看完書之後的測試結果,生成詳細的報告,幫助老師監督孩子的閱讀進程,並在適當的時候給予讚賞和鼓勵。

Accelerated Reader 的推廣賣點

1994 年,Terry 任 CEO 的商業電腦備份系統公司 Best Power Technology 被收購,他全職加入 Renaissance,並於1996年推出第一代 STAR 測試系統。通過當時最新的計算機自適應測試理念,用較短的時間測試學生的閱讀能力,供老師為個別學生製定閱讀計劃時參考。

到了2011年,STAR 測試系統已經發展到了第三代。測試內容從傳統的只有詞彙含義一項,改為 Item Response Theory (IRT) 的25項不同方面的能力測試,準確度、穩定度和誤差都有了顯著的改善。

STAR 的推廣賣點

Terry 長袖善舞,成功說服了不少學校把 AR 和 STAR 作為申請州和聯邦政府教育撥款的項目。由於剛好趕上了美國教育標準化的大潮,AR 和 STAR 十幾年間就成為了美國最多學校選用的閱讀支援系統,也在各大媒體和學術期刊上引發多次激烈爭議,火花四濺。

不要用 AR 的18個理由

這場論戰從 90 年代一直持續到今天,仍未有定論。 Renaissance 公司雖然號稱 AR 和 STAR 有大量科研支持,但有不少知名語言和教育學家(如南加州大學的克拉申,奧爾巴尼大學的 Joette Stefl-Mabry),都對這些科研的可信度提出質疑。加上不少證明 AR 和 STAR 有效的研究人員跟 Renaissance 公司之間存在著各種直接和間接的關係,他們作出的科研設置和提供的數據往往都耐人尋味,更令事情進一步複雜化。知名的獨立研究人員很少能夠發現 AR 和 STAR 能大幅提升學生閱讀能力的強烈證據,頂多只能找到對低年級學生有少許幫助的跡象。

美國教育部教育科學研究所轄下 What Works Clearinghouse (WWC) 2016 年發表的官方報告中,審核了71份 AR 有效性的科研報告。其中 60 份被認定水平過低,9 份被認為研究設置未達到標準,僅有兩份達到 WWC 對科研要求的設置標準和水平。從這兩份科研報告中, WWC 認定有證據顯示 AR 對學生閱讀理解能力有少量的正面作用,但也有一定的負面作用。對學生閱讀流暢度則沒有任何能被察覺到的影響。

What Works Clearinghouse 2016年針對 AR 發表的官方報告結論

眾多反對意見之中,STAR 測試的可靠程度以及 AR 對學生的閱讀引導方向是最引人詬病的兩個部分。即使是支持 AR / STAR 的老師,也都強調自己只把測試結果作為參考數據之一,絕不全盤信賴,並且會自行調整引導學生閱讀的方向,避免依賴 AR 的各種不良後果。

AR / STAR 系統是針對美國本土一般孩子開發,評估成績對英語非母語學生並不適用。美國學校的專業 ESL 老師,一般不會為英語非母語學生選用這套系統。 Renaissance 公司為了怕引起誤會,更在提供給老師的 STAR 測試系統技術指南中,特意強調如果老師為英語非母語學生或部分特殊兒童測試時提供額外時間,需要注意在這種情況下測試出的成績是末經調整,不能作準的。

Extended time may be a valuable accommodation for English language learners as well as for some students with disabilities. Test users who elect the extended time limit for their students should be aware that STAR Reading norms, as well as other technical data such as reliability and validity , are based on test administration using the standard time limits. When the extended time limit accommodation is elected, students have three times longer than the standard time limits to answer each question.

可是使用 AR / STAR 系統的中國家長,一般都是通過網上推廣資訊和口耳相傳了解這套系統,很少有機會接觸具體的技術指南。以訛傳訛之下,AR 和 STAR 自越洋來到中國後反而搖身一變,成為不少原版家長們完全信賴的權威系統。

中國孩子每天原版看得再多,也會跟美國孩子有一定的差距。閱讀能力如果達到接近同齡美國孩子的水平,已經十分難得。超出一、兩年的,更是鳳毛麟角。但由於 AR / STAR 測試中國原版娃時,系統往往會把時間限制大幅放鬆,設置成三倍於美國孩子,造成大量原版娃測試後都能取得「超英越美」兩三年的虛高成績,誘使眾多家長陷入狂熱之中。不少家長如果孩子測試出的閱讀水平「只」超越美國同齡孩子一兩年,竟已會感到挫折。

在有心人的推波助瀾之下,AR / STAR 成績「放衛星」一波比一波嚴重,到了後期,甚至有博主宣揚一年級已達「AR 9.1」的荒唐案例,害慘了不少優秀的孩子。

STAR 成績虛高已經達到「畝產萬斤」的程度

原版英語本是一件非常美好的事情,每一個家長都可以根據孩子的具體需要,循序漸進、自然地幫孩子打好英語基礎。不僅為孩子免去學習外語最難階段的各種辛苦,更能加強親子關係,建立一段美好溫馨的回憶。

但若家長被虛高的 AR / STAR 成績誤導,不理孩子的實際情況,盲目根據電腦測試結果為孩子選擇超前讀物,只會把一件賞心樂事變成艱苦萬分。導致孩子學得越來越辛苦,進步越來越慢,越來越抗拒英語。在這種情況下家長如仍不知難而退,改為選擇適合孩子的讀物,反而堅持繼續攻關,很容易令孩子迷失方向,卡在超前教育的牛角尖裡面,「雲橫秦嶺家何在?雪擁藍關馬不前」。

過去兩年間,有不少天資優秀、積極進取的原版娃,因學習進展開始停滯,希望尋求專業老師的教導而來到拔萃。本來只要為他們提供適合的材料和良好的引導,這些孩子都能夠在英語學習的路上走得特別快、特別遠。不幸部分家長在孩子虛高 AR / STAR 成績的影響下,已無法接受專業老師的客觀意見,拒絕老師根據孩子的實際能力選擇的適合教材,堅持要求超前再超前。

拔萃是一間營利教學機構,家長提出的要求但凡有半點可行性,我們肯定盡力而為。可是我們無法為了迎合家長,要求老師製作明知對孩子有害的教學方案。即使我們真的願意提出這種要求,任何具有專業責任心的老師也一樣會斷然拒絕。所以最終只好承受流失這批高影響力學生/家長的無奈後果。

AR / STAR 系統是針對美國本土一般學生設置。美國學生加時測評的結果已經意義不大,對中國優秀原版娃更是沒有參考價值。如果家長希望掌握孩子英語能力的進度,即使沒有專業老師,單靠自己也能做得遠比 AR / STAR 系統準確。

原版英語本是一件非常美好的事情

家長可以根據學生程度,挑幾份學生從沒看過、不同程度的分級讀物,每份選出一段幾十到幾百字的部分進行測試。

在測試之前,家長應該先查完詞典,自己完全弄清文章意思之後,讓孩子朗讀一遍,並用電腦或其他工具錄製下來。讀完之後讓孩子用中文解釋一遍大概意思,然後再對照原版音頻,統計念錯了多少、自我糾正的頻率、念的速度快慢,以及理解有多少錯誤。

如果只有一兩個錯誤,閱讀流暢,沒有經常停頓,對文章的理解基本正確,孩子又不覺得難,就可以視為孩子完成了這個級別

這樣測試的結果會遠比 AR / STAR 全面和真實,家長才能為孩子挑選到適合的讀物。

孩子年紀小,理解能力、專注度有限,如果超負荷安排學習計劃,孩子就會產生逆反、排斥心理,不僅學不好,還會產生厭學情緒,結果會適得其反。即使貌似孩子學會了,也容易造成一些知識掌握浮於表面、不求甚解,這樣的學習習慣也不利於孩子以後的發展。

超前教育是令孩子落後最有效的方法!