從2000年開始,我們從PISA的題庫中挑選出了一批題目,進行了大數據分析,來看PISA是如何來監測教育質量,再對比我們目前不少地區正在進行的教育質量監測,可以發現,不合理的教育質量監測方式,也許會使我們的教育正與我們的期望南轅北轍。
對教育質量的監測與學校評價指標掛鉤,使得學校不可避免地操練學生
這個世界上的教育正在發生什么?
亞洲幾乎所有的國家,不論巴基斯坦還是瓦努阿圖,幾乎都在對所有的學校和年級進行持續的教育質量檢測。
中國也在做學生的學業質量監測考試,定期監控所有學生的成績,再根據所有學生的成績,得到一個班級、一個年級、一所學校,乃至一個地區的成績,最終匯總成我們的教育質量。
但是近兩年來,歐洲、美國很多地方的學生、家長都反對質量監測。最重要的原因就是,現在的教育質量監測,使得我們學生的負擔越來越重,并且不可避免地陷入到了一種應試的操練之中。
最簡單的就是,現在所有的教育質量監測,都與學校的各種評價指標有著直接的影響,在這樣的情況下,學校和老師必然會想方設法提升學生的表現。
經驗告訴我們,所有有責任心的老師都知道要想考好成績,只有一個方法,就是加班加點,老師和學生一起加班加點去應付考試。
學生不可避免地成了“陪葬品”。因為教師必然要操練學生。
雖然家長會支持老師給學生多一點操練,但是一旦孩子回來說,每天晚上功課要因此做到12點,那么家長必然會反對。
當然,也有家長愿意選擇這樣的生活。因為從某種程度上來說,考試為一部分人提供了改變命運的機會,所以他們希望考試,根據分數來評定學生。
但是,大多數情況下,在家長反對的重重壓力下,教育主管部門為了減輕學校操練的壓力,所有地方的解決方法就是-——-只監察低能力水平,避免追求高分數所帶來的操練。
比如香港只列出合格線;美國的NCLB(不讓一個孩子掉隊),只監察最低級;有些地方原本分四級監控的,現在只有是否達標。
然而,是否達標這一監控線,對于政府和學校來說信息太少。因為這些只關注基本能力的題目對學生來說,在各個能力區的分數敏感度都很低,監控能力相對也就低。
而且為了避免學生感覺困難,題型非常狹隘。這也造成了只有幾種題型主導課程教學,這樣的測試并不理性。
對很多學校來說,這樣的監測做和不做,并沒有什么影響,不做也知道學校合格率是85.3%。如果題目太淺了,對于好一點的學校意味著-——-這樣的考試是浪費時間。
更令人擔憂的是,如果所有的題目都監測最低等級,那么這些題目就必須要保證大多數學生合格——那就意味著這些題目必須簡單!
僅以香港為例,很多家長希望這些考題自己的孩子都見過,甚至有時候學生考到的題目他們沒有見過,就會責怪教育質量監測機構——“每年都出新的應用題,小孩要操練得越來越辛苦!”
于是老師為了保證所有的題學生都有機會見過,就要編很多新的應用題讓學生訓練,這就出現了題海戰術。
這也是為什么現在中小學的校長們有很大壓力的原因。因為我們現在要如何培養學生呢?猜怎么出題。
為了應對各種質量監測以及各種考試,老師會猜考試的題目,也許也會出一些很多其他地方都沒有見過的題。如果監測時準備出100道題,他就會出2萬道題,他要保證你的100道題在這2萬道題中。
如果考的題目學生全部見過,那我們考的是他的能力還是考他的記憶力?我們的目標是考素養,但如果這樣的考試,那就是考記憶力。
那么當我們不斷在考記憶力的時候,學生操練得到的回報是高還是低?在這樣的情況下,操練更加厲害。
事實上,我們的調查發現,經過十多年的訓練,每個地方都出現這些問題。
教育關注的應該是增值,而非絕對值
事實上,教育質量的監測如果只設立合格線,那對教育質量是徒勞無功的。因為教育應該關注的是增值,而不是它的絕對值。
一講絕對值,所有學校都無需提升教學能力,也無需提升教育質量。因為如果招收的學生是最好的學生,那么畢業的時候成績必然會好。所以我們永遠應該關注教育的“增值”部分才對。
如果一所學校能夠使得學生的質量提升迅速,那么這樣的學校,才是有著優質的教育。所以,當我們監測一所學校的教育質量時,我們關注的應該是學生在這所學校的分數的提升,是跨年的質量波動。
事實上,現在連PISA每年的測試都在改變。2000年PISA的監測內容與現在的監測內容相比已經有了很大的變化。
2000年至今,PISA測試在檢查學生的能力、興趣、自信等,它總共用了70多組的題目,每組題目含幾道題目。然而70多組的題目,沒有一組題目是每次都用的,除了性別。有55組題目只用過一次。
而且PISA測試都是緊貼當前教育最關心的議題,比如網絡成癮,十幾年前沒有這個題目。
對于我們的教育主管部門來說,需要的不是監控所有的學校都必須“合格”,而必須監控所有的學校都在進步。
教育質量監控的重點,不是從接受質量監控的100所學校中找到最差的5個學校,而是希望這100個學校都進步。這也是PISA測試的科學之處,它的測試是希望所有國家都有進步,而不是找全世界最差的國家。我們每年驗收檢查它的新的部分,所有國家都有改進的地方,所以到最后大家都有改進。
而且,對于教育來說,過于頻繁的教育質量監測并不好。因為秤豬不會讓豬更肥,反倒是減肥一定要買秤。
教育質量監控也不是只考學生常見的題目,這樣的監控使得我們無法知道我們究竟在考察學生的記憶力還是在考學生的理解力,而且只會讓學生操練得更厲害。
教育質量監控不應該只監控學校教學
在我們所謂的質量監測中,很多變量是教育領域的專家很難去關注的。
我們測的質量究竟是什么質量?OECD的很多題目中,其實都是很有道理的,比如:
1、改善學生學習能力,最有效的兩種方法?改善學習有什么方法?三年級班,初中三年跟小學三年,睡覺的時間相差多少?沒有睡八個小時的初三學生有多少?
2、小學三年級與初中三年級,上床就寢時間相差多少?
3、初中三年級,能有八小時睡眠,占用百分之多少?
4、初中三年級,男還是女更遲睡覺?
5、若只能睡六小時,早點睡覺是否更好?
6、家中藏書多成績越好?
7、焦慮高的學生,睡眠時間越短?
8、高社經地位學生成績更差?
9、高社經地位家長更經常與學生探討學校生活?
10、孩子總是認為父母(經常/很少)與他們討論學校生活嗎?
11、初中學生,百分之多少每天多吃早餐?
12、男女吃的早餐種類有何分別?
13、家庭社經地位較高學生,更常吃早餐嗎?
14、早餐對貧或富學生的貢獻有分別嗎?
15、班中較早月份出生學生(年齡大數個月).成績更佳嗎?
調查發現,家庭文化程度、家庭的收入、孩子是否運動、孩子是否早睡、家長是否跟孩子討論學校生活,與孩子的成績是相關的。
有沒有吃晚飯,有沒有閑談,其實這類題目都是PISA里最好的題目。尤其是否吃早餐對學生的學業成績很重要。
說到底,我們要改變教育,而不是監控教育。
(本文作者為香港中文大學教育心理學卓敏講座教授,也是PISA2018香港地區的主要負責人,并參與了上海教育質量指標的制定)