鄭東輝,葉盛楠. 基于學生視角的課堂評價行為問卷編制與調查[J]. 全球教育展望,2023(5):63-80.
摘要 本研究從學生視角解析課堂評價行為,考慮中小學的評價情境,形成問卷測試條目。對678名中小學生進行問卷數據的項目分析和探索性因素分析,對652名中小學生進行問卷數據的驗證性因素分析,結果發現:課堂評價行為問卷是一個三因子的整體結構,分別是教師的課堂評價行為、學生自我評價行為、學生同伴評價行為,共計37個條目。通過對正式問卷的內部一致性信度、分半信度、內容與結構效度檢驗表明,該問卷具有較高的信效度,可用于測評小學四年級至高三年級學生的課堂評價行為狀況。抽樣某縣16758個中小學生進行正式問卷的調查,結果發現:課堂評價行為總體水平中等偏上,但內部存在差異,學生的自我評價和同伴評價明顯低于教師的課堂評價,而且在性別、學段、城鄉和成績上存在顯著差異。我們需要正視課堂評價的整體性,審視課堂評價行為水平的差異性,重視學生特征對課堂評價行為的影響。
關鍵詞 中小學生;課堂評價;問卷編制;調查
作者簡介
鄭東輝/寧波大學基礎教育評估研究中心主任,教師教育學院教授 (寧波 315211)
葉盛楠/浙江師范大學教師教育學院博士研究生 (金華 321004)
中小學生每天都經歷著課堂評價,他們對課堂評價的感知與行為直接影響他們的學習生活。利用問卷來了解學生關于課堂評價的真實感受和實際行動,把握課堂評價的現實狀況,采取適切的改善或優化策略,發揮評價的育人功能,成為新時代學生評價改革的重要議題。為此,從學生視角出發,按照問卷編制的基本程序,開發課堂評價行為問卷,了解課堂評價行為的現實狀況,為挖掘學生評價改革所需要的數據提供研究工具和分析視角。
01
課堂評價行為的分析框架
美國學者杰克遜(P. W. Jackson)在《課堂生活》一書中這樣描述課堂評價:“課堂評價明顯來源于教師。他要不停地對學生的作業和行為做出判斷,然后把自己的判斷告訴學生和其他人?!?,教師不是唯一傳遞判斷的人。同學們也經常參與到評價這件事情上來。……教室里還有第三個評價來源,比教師和學生的正面評價、負面評價更加難以描述。這類評價包含自我判斷,是在沒有任何外部評價干擾的情況下出現的?!?sup>[1]盡管他以此強調課堂評價的復雜性、多樣性和隱秘性,但課堂評價的三類行為主體是清晰的,即教師、學生同伴和自我。仔細考察當下的日常課堂評價活動,也有類似發現,如教師對作業的講評、學生之間圍繞作業互評、學生針對作業結果的自我評價。近些年來,有關課堂評價主體的學術討論也越來越傾向于師生多主體,如具有廣泛影響力的《課堂評價研究手冊》就將課堂評價視為“教師和學生收集、評估和使用學生學習的證據,用于各種目的(諸如診斷學生的優缺點、監測學生達到所需熟練水平的進展、向家長提供反饋)的過程”[2]。問題在于怎樣將他們各自發生的課堂評價行為分門別類,以指導問卷題目的設計?;诓煌暯牵瑫胁煌男袨榉诸惻c表現。有關課堂評價行為的研究視角卻很單一,大多是從教師視野看待課堂評價行為,由此考察教師及其引導下的課堂評價行為,即使將“學生參與”作為高質量課堂評價要素的斯蒂金斯(R. Stiggins)也只是將學生納入教師的指導范疇:“讓學生參與評價”[3]。課堂評價作為一種日常的非正式評價,不同于旨在測量學生學業水平的外部評價,它關注學生的學習,并助推學習發生積極的變化。是否發生了變化、發生了怎樣的變化,作為課堂評價實際感受者和行動者的學生是最有發言權的。為此,本文嘗試從學生視角來解析課堂評價行為,把握各類主體的行為表現及其水平,洞察服務學生高質量學習所需要的行為改進空間。所謂“學生視角”,就是學生對教師課堂評價的具身感知與體驗,以及對自我和同伴學習的評價行動。
對于教師的課堂評價行為,主要從形式與方法兩個角度來解析。從實踐形式來看,“課堂評價包括了課堂問答、課堂測驗、課堂觀察、課后練習和作業,以及與學生的談話等具體形式”[4]。有學者將此簡化為“考試或測驗、課堂作業或家庭作業、提問、觀察”[5],也有進一步豐富為“運用選擇和簡答任務評價、運用擴展反應和表現性任務評價、觀察、評分、解釋與交流評價結果”[6]等形式。這些形式均以任務為載體開展評價實踐,有些也包含某些方法的成分,如測驗、表現性評價。從方法的角度,有歸為四類的,“選擇性反應評價、論述式評價、表現性評價、交流式評價”[7];也有歸為五類的,分別是“課堂觀察、課堂測驗、課堂師生對話、課堂問卷調查以及課堂表現性評價”[8];還有六類的,即“選擇反應與簡單的建構反應評價、論述評價、表現性評價、口頭提問、教師觀察”[9]。這些方法不只是基于心理測量的測驗類方法,還包括基于表現建構的新型評價方法,如表現性評價、交流式評價等。從學生可感知的角度來看,形式角度的分類可能更合適,因為學生能夠直接體驗到教師給予的評價任務。然而在這些形式中,也有學生無法知曉的,如教師的觀察,因為學生很難察覺教師是否在觀察自己,除非接受到某種評價任務,但這又屬于觀察之后做出的其他形式的評價行為了。為此,以實踐形式為依據,參考其中涉及的學生可感知的方法,將教師的課堂評價行為分成課堂提問、課堂練習、課外作業、測驗、表現性評價等五類。其中,表現性評價作為新型方法的代表,已廣泛應用于課堂教學。它是指在盡量合乎真實的情境中,運用量規對學生建構的答案或創作的作品進行判斷、建議與改進,要求學生主動建構意義,而不是被動地重復孤立的事實。具體來說,表現性評價是給學生一個復雜的學習任務,協商形成評價任務表現的量規,師生依據量規對任務表現進行形成性評價。之所以要把課堂練習從作業中獨立出來,是因為它不同于相對正式的課外作業,它的任務不太復雜,耗時短,需要師生即時性的互動。另外,它在課堂上的運用頻率比較高,也很容易被學生識別。
在自我評價活動中,主體把自身作為評價對象,形成主客體之間的“自反性結構”,發揮主體的能動性,以揭示主體與作為客體的主體之間的價值關系的本質和規律。[10]落實到學生學習上,就是學生對自我學習的一種自反性認知,揭示學習對于自我成長的意義。從寬泛意義上說,學習領域的自我評價是學生對自己學習和學習能力的描述與評估。[11]它不僅評估自己的學習工作,還包括學生為評估做出的各種努力,比如“主動從各個來源收集關于他們工作質量的反饋,以評估他們自己的表現”[12],為評估做好準備與計劃。可以說自我評價是“學生收集關于自己表現的信息,根據他們選定的標準來評估和反思學習過程和結果的質量,進而明確自己的長處和短處”[13]。它不是一個線性過程,而是不斷循環的。學生先要明確評估自己表現的標準,然后主動尋求基于標準的各個方面(如教師、同伴、自我)的反饋,進而根據這些反饋反思自己的學習表現,明晰可改進之處,最后調整自己的學習內容與方向,進一步優化自己的學習目標與計劃。也就是說,“評價過程中的自我判斷和自我監控指向學生學習目標改進,而學生學習目標的改進可以促進學生自我判斷和自我監控的發展”[14]。在這個循環過程中,學生需要回答“我現在在哪里”“我如何去那里”“下一步該去哪里”等問題,也就是要經歷“預先計劃、表現和控制、反思等階段”[15]。由此,與這三個階段相匹配的自我評價行為也變得清晰起來,學生首先要對自己的學習進行自我計劃,如明確自己的學習目標和評價標準以及需要采取哪些行動來達成目標。其次,在實施過程中不斷反思自己的行動,如尋找來自內外部的學習反饋、基于評價標準進行自我判斷、審思自己的進步與不足等。最后,基于反思結果及時調整學習計劃與行動。以課后作業任務為例,學生首先“對作業應達到什么目標有清晰的認識與規劃,然后能對作業質量進行判斷和改善”[16],最后能對作業的時間安排或錯題進行自我修正與調整。
在學習領域,同伴評價通常是指讓學生去評估跟他們地位相似的同伴的學習成果。[17]在早期,主要聚焦學習結果的同伴評價,“將同伴評價看作一種成就或表現的評價形式,包括同伴提名或推薦(peer nomination)、同伴評定(peer rating)和同伴分等(peer ranking)三種方式”[18]。20世紀末以來,學界越來越將同伴評價看作一種學生參與學習的方式,[19]不僅評價結果和過程,方式也不再局限于量化,而是更多地運用質性反饋。在長期研究同伴評價的著名學者托平(K. J. Topping)看來,同伴評價可以是定量的,即根據一個等級分配一個數字,也可以是定性的,即對積極和消極的方面以及改進的可能性給予豐富的口頭反饋,或者兩者兼而有之。[20]通常而言,同伴評價是相互的,特別是質性的反饋,存在相互學習的可能與機會。同伴評價還可以是學生之間相互鼓勵,即同伴鼓勵。綜合起來,同伴評價方式主要有三類:定量的同伴評定或分等、定性的同伴建議(口頭反饋)、質量融合的同伴鼓勵。如果考察中小學生的日常同伴評價行為,就會發現這些評價方式是比較普遍的,而且也是學生日常行動的表現形式。為此,我們將同伴評價行為區分為同伴評級、同伴建議、同伴鼓勵?!巴樵u級”是學生依據某個標準或答案,對同伴的學習表現做出量的判斷,如排名、評分、分等。“同伴建議”是學生為同伴的學習表現提供詳細的反饋,與同伴討論進一步學習的各種可能,如基于評價量規的描述性反饋[21]。同伴鼓勵是同伴之間圍繞某項任務進行相互鼓勵與學習,源于學生之間的自發行為。
綜合上述分析,基本理清了學生視角下的課堂評價行為類型。從上面的某些行為表征來看,這些行為類型不是價值中立的,而是基于“促進學習的評價”理念的一種指向育人的積極向善的評價。促進學習的評價是“發現和解釋證據的過程,這些證據被學習者和教師用來決定學習者在哪個階段學習、需要達到什么目標以及如何最有效地實現目標”[22]。在這個過程中,評價不是對學習做出判斷,而是融入、支持、引發學習,甚至成為一種學習過程,變成學生“實現自我監控、自我糾正或調節的過程”[23]。評價不是目的,而是實現學習增值的工具,“讓學生在增強學習動力、學會新的方法、達成學習目標和實現有意義的學習等方面有所收獲”[24],最終指向學生的成人。
02
問卷試測與分析
(一)課堂評價行為初始問卷編制
依據課堂評價行為框架,通過四個步驟收集數據和編寫問卷題項。一是學生開放性訪談。本研究在寧波市選取小學、初中、高中各一所,訪談小學一年級至高中三年級60人(每個年級5人),收集有關教師的課堂評價、學生自我評價、學生同伴評價方面的自我陳述條目216條。通過對這些條目的編碼、歸類,提取出含義清晰且荷載單一的條目136條。
二是收集與課堂評價行為三個維度相關的問卷,主要是“中小學教師課堂評價知識調查問卷”[25]“學生自我評價實踐量表”(SaPS)[26]“同伴評價問卷”(PAQ)[27],選取問卷的相關題目,作為題目編寫的原始素材。從這些問卷中摘取出56條,其中教師的課堂評價行為26題、學生自我評價行為20題、學生同伴評價行為10題。
三是學生認知訪談與調查。綜合第一、二階段兩方面結果,形成初步的課堂評價行為題目,邀請中小學教師和學生逐條討論,初步確定97道題目。為了檢測學生能否讀懂題目意思以及對題目的理解是否與設計者的理解一致,研究者訪談了15位小學生、18位初中生和11位高中生,并根據訪談結果刪減至69題。另外,訪談發現小學生有許多讀不懂的字詞句。為了進一步確認正式問卷調查對象的起始年級,研究者選擇寧波市江北區一所小學,在一至六年級中各選擇一個班級進行題目閱讀測試。通過測試,發現兩個問題:一是讀不懂的地方主要集中在行為動詞及其修飾詞上,如輔導、提煉、提醒、咨詢、挑戰性、針對性、憑直覺等。二是讀不懂地方的數量表現出明顯的年級差異,四年級是一個分界線,四年級及以上的學生讀不懂的地方顯著減少,諸如“評價標準”“表現行為”“情緒”之類在四年級學生看來易懂的詞在低年級學生那里卻成了難懂的詞。為此,研究者將調查對象限定在小學四年級至高中三年級,并對個別詞句進行修改,刪除部分題目,形成59道題目。
四是征求專家意見。設計含有問卷維度結構與對應題目的專家咨詢表,請五位專家(三位是研究課堂評價的大學教授,兩位是中小學正高級教師)對59道題目進行內容效度的檢測,即對每個題目進行三個等級(必不可少;有用,但不是必需;沒有必要)的評估。根據內容效度比(the content validity ratios)[28]要求,只有三位及以上的專家認為該題目是“必不可少”才能保留。結果顯示,8道題目沒有達到內容效度比要求。
綜合上述,最終確定的初始問卷由51道題目構成,其中教師的課堂評價行為22題、學生自我評價行為20題、學生同伴評價行為9題。這些題目都是正向的表述,即反映了促進學習的評價理念,使用李克特等級量表設置選項,分別為“很不符合”“不太符合”“有些符合”“比較符合”和“非常符合”。
(二)試測對象
1. 預測的對象
為了考察問卷的結構和篩選項目,研究者在寧波市3所學校(小學、初中和高中各一所)進行預測。以班級為單位,在3所學校的每個年級隨機整群抽取2個班級的學生作為預測樣本,共發放問卷714份,有效收回678份。在有效問卷中,小學四年級至高中三年級分別有85人、88人、63人、78人、63人、63人、83人、80人、75人,其中女生336人,男生342人。
2. 正式試測的對象
研究者在寧波市選擇普通小學、初中、高中各一所,以班級為單位,在3所學校的每個年級隨機整群抽取2個班級的學生作為試測樣本,共發放問卷700份,有效收回652份。在有效問卷中,小學四年級至高中三年級的人數分別為68人、59人、68人、79人、85人、76人、77人、70人、70人,其中女生303人,男生349人。
(三)項目分析
利用臨界比值法進行項目分析。首先,計算問卷總分并排序,以最高的27%和最低的27%作為高分組與低分組界限,對高、低兩組的各項目得分進行獨立樣本t檢驗,其區分度均高于顯著性水平(p<0.001),無刪除項目。其次,計算每個項目與問卷總分之間的相關系數,結果顯示,項目13與總分的相關系數為0.385,相關度低,故刪去該項目,其他項目與總表相關程度在0.442—0.814,且均呈顯著性差異(p<0.01)。經過項目分析,共剔除不合格項目1個,保留項目50個。
(四)探索性因素分析
首先,對問卷進行探索性因素分析的適當性考察,得到KMO值為0.977, Bartlett球形檢驗結果χ2=24503.754(p<0.001),表明該問卷適合進行探索性因素分析。
其次,通過主成分分析法進行因素抽取得到初始負荷矩陣,特征值大于1的因素共有5個,解釋總變異的60.280%。結合使用碎石檢驗確定因子個數,根據第一個碎石點開始的陡峭程度,從第一個點到第二個點非常陡峭,第二個點到第三個點略有陡峭,第三個點之后基本趨于一致性平緩,即第3個因素以后的因素對解釋原始變量的貢獻較小,故選取三個因子更為合適。
隨后,采用指定因子法和最大方差旋轉再次進行因子分析(見表1)。對分析結果進行題項純化,純化的標準是刪除旋轉后因子負荷值小于0.4,或者同時在兩個及兩個以上因子上有載荷且載荷之間的差值小于0.1的項目。初始因子載荷矩陣經過3次迭代后得到旋轉后因子載荷矩陣,結果符合分析框架與統計學要求,最終剔除項目共13個。對剩余37個項目再次進行因素分析,發現3個因子的特征值均大于1,可解釋的方差累積貢獻率為58.890%,旋轉后的各項目負荷均在0.550以上,表明因子分析效果很好。
表1 課堂評價行為的因子負荷分析表
最后,根據課堂評價行為框架以及項目本身的內涵,對個別項目的因子歸屬進行了微調,將項目29、項目51調整至因子三,并針對每個因子所包含的項目意義進行命名。因子一:教師的課堂評價行為,有17個項目;因子二:學生自我評價行為,有12個項目;因子三:學生同伴評價行為,有8個項目。
(五)驗證性因素分析
使用正式試測的樣本數據,對探索性因素分析后形成的37題初始問卷進行KMO和Bartlett球形檢驗,得到KMO值為0.971,Bartlett球形檢驗結果χ2=15663.004(p<0.001),表明數據適合進行驗證性因素分析。利用AMOS20.0分析工具,運用驗證性因素分析方法(CFA)對問卷結構進行擬合性檢驗。
根據探索性因素分析結果,設定3因子為潛在變量,37個題項為觀察變量,e1—e37為誤差項,采用最大似然法對結構模型進行驗證擬合,在初步結果的基礎上,利用修正指標(Modification Indices,簡稱MI)優化擬合模型,在若干誤差項之間建立相關關系,最后得到各項擬合指數(見表2)。各項模型擬合指標符合整體模型適配度檢驗指標。
表2 驗證性因子分析中擬合指標分析結果
通過進一步的模型分析,各因素負荷在0.54~0.87之間,表明模型結構設計合理,具有良好的構想效度,驗證了理論假設。具體見圖1。
圖1 問卷驗證性因素分析模型
(六)信效度分析
經過探索性與驗證性因素分析,對總問卷與各因子進行Cronbach's α信度和分半信度檢驗,結果顯示:總問卷Cronbach's α信度為0.961,分半信度為0.871,各因子的信度分布在0.839—0.947(見表3),表明該問卷具有較高的內部一致性及評估穩定性。同時,通過以上探索性因素分析與驗證性因素分析,得到良好的擬合數據,證明問卷具有較為理想的內部結構效度。
表3 問卷及其因子信度系數
03
正式問卷調查結果與分析
本研究利用正式問卷,在寧波市某縣進行抽樣調查。以該縣39992名小學四年級至高中三年級學生為總體進行分層整群抽樣,分層主要考慮學校所在地和學段,并兼顧學校水平,把所抽到的班級作為群單位。對于所抽到的學校,所有班級的全體學生均參與問卷調查。通過分層抽樣,最后隨機抽取了11所小學(4所城區、7所鄉鎮)、8所初中(3所城區、5所鄉鎮)、2所高中(1所城區、1所鄉鎮)。本次調查向上述樣本地區發放18585份問卷,回收問卷18196份,剔除不合格問卷后,獲得16758份有效問卷,有效率為92.10%。具體樣本情況如下:男生8387名(占50%),女生8371名(占50%);四年級學生2472名(占14.8%),五年級學生2433名(占14.5%),六年級學生2426名(占145%),七年級學生2372名(占14.2%),八年級學生2365名(占14.1%),九年級學生1258名(占7.5%),高一學生1399名(占8.3%),高二學生1252名(占75%),高三學生781名(占4.7%);城區學生7730名(占46.1%),鄉鎮學生9028名(占53.9%)。調查于2022年5月完成,有效問卷數據經編碼后輸入電腦,運用SPSS 22.0軟件統計處理。
(一) 課堂評價行為的總體情況
以平均水平3作為檢驗值進行單樣本T檢驗,結果如表4所示,課堂評價的總體行為均分及其三因子均分全部顯著高于平均水平。其中,課堂評價的總體行為均分為3.84,超過3.50,接近“比較符合”的上限,達到“中等偏上”水平。學生能感知到的“教師的課堂評價行為”得分為4.00,明顯高于學生自我評價與同伴評價,達到“高”的水平,學生同伴評價相對弱一些,但得分也超過3.50。可以看出,盡管存在一些內部差異,課堂評價行為總體表現出比較積極的狀態。
表4 課堂評價行為的具體表現
進一步對課堂評價行為三因子下屬的各項指標進行單樣本T檢驗,結果如表5所示,所有指標均分全部顯著高于中等水平3。其中,教師課堂評價行為中的測驗、課堂提問得分達到“高”水平,學生同伴評價行為中的同伴評級、同伴建議得分相對偏低,屬于“中等偏下”水平,同伴鼓勵卻接近“高”水平??梢?,教師的課堂評價行為和學生同伴評價行為內部還存在較大的差異。
表5 課堂評價行為各指標的具體表現
(二)課堂評價行為在學生特征上的差異
1. 性別差異
分別以課堂評價總體行為及其內部三因子的得分為因變量,性別為自變量,進行獨立樣本T檢驗(見表6),結果顯示:在課堂評價總體行為、教師的課堂評價行為和學生自我評價行為上,女生平均得分均高于男生,且存在顯著差異??偟脕碚f,女生對課堂評價行為的感知以及自我評價行為強于男生。這可能與女生對課堂評價更投入,或者對課堂評價有著更為細膩的情感體驗有關。
表6 課堂評價行為的性別差異
2. 學段差異
因變量同上,以學段為自變量作單因素方差分析,結果顯示:小學四年級至高中三年級在4個因變量上的得分均存在顯著差異,而且課堂評價行為得分隨年級升高而遞減(見圖2)。其中小學生與中學生的得分存在質的差異,即小學生的課堂評價行為達到“高”的水平,而中學生處于“較高”水平。在有關“不同學段、年級學生對教師評價行為知覺”的研究中也有同樣的發現,“小學生的知覺得分顯著高于初中生”[29]。由此看來,年級越低,對課堂評價的敏感度和行動力越強。但學生在自我評價能力上的表現與我們對“年齡越大自我評價水平越高”的傳統認識不一致,這可能與年齡越大自我評價越理性或謹慎有關。
圖2 課堂評價行為的學段差異
3. 城鄉差異
因變量同上,以城鄉為自變量作獨立樣本T檢驗(見表7),結果顯示:城區學生在4個因變量上的得分均高于鄉鎮,且存在顯著差異。這可能與城區良好的教師資源有關,城區的學生可能有更多的機會接觸和實施新型評價形式,而且能得到教師在評價上的指導。
表7 課堂評價行為的城鄉差異
4. 成績差異
因變量同上,以學生期末考試成績(將學生語文、數學、英語三科期末考試成績折算成Z分數,從高到低排序,前1/3為高分組,中間1/3為中等組,后1/3為低分組)為自變量作單因素方差分析。結果顯示:學生成績分數越高,課堂評價行為各項得分就越高,且不同成績組之間呈現顯著性差異(如圖3所示)。這可能與成績較好的學生更會利用課堂評價來改善學習有關,因為“課堂中的形成性評價能提高學習成績”[30],而且有關影響學業成就的800多項元分析也發現“教學中的形成性評價對學業成就的效應值高達0.90”[31]。可以說,學習成績與課堂評價互為促進。
圖3 課堂評價行為的成績差異
(三)課堂評價行為各因子之間的相關性
對課堂評價總體行為及其內部三因子進行相關分析(見表8),結果顯示:課堂評價總體行為與教師的課堂評價行為的相關系數為0.890,與學生自我評價行為的相關系數為0.897,與學生同伴評價行為的相關系數是0.834,課堂評價三類行為之間的相關系數均超過0.50,且均在0.01水平上呈顯著性差異。如此高的相關性,可以進一步說明課堂評價行為內部結構具有很好的擬合性。
表8 課堂評價總體行為各因子的相關關系
04
研究結論與討論
經過規范而嚴格的編制過程,又通過大樣本調查的檢驗,最終形成的問卷質量得到了充分的保證。問卷由37道題目構成,以5點等級量表形式記分,從很不符合到非常符合,依次記1—5分,具體見表9。下面就該問卷的適用性與調查結果對于研究與實踐的啟示作進一步討論。
表9 正式問卷結構與題目
(一)問卷的適用性與價值
任何問卷均有其適用性和局限,本問卷也不例外。由于需要學生能對自我和同伴做出評價,且能感知到和自我報告教師的課堂評價行為,故本課堂評價行為問卷用于測評小學四年級至高三年級學生的課堂評價行為狀況,不適合用于小學低段和幼兒園學生。正因為需要學生感知和報告,某些學生無法接觸與體驗到的教師課堂評價行為就不能納入問卷題項,如教師的觀察,教師對提問、練習、作業、測驗以及表現性評價上的設計行為,這使得課堂評價行為是不完全的。要想呈現課堂評價的全部行為,就需要開發適用教師和學生的兩份問卷,教師的課堂評價行為在教師問卷那里更完整,學生的自我評價和同伴評價在學生問卷那里更充分,這也是后續問卷開發的新方向。總之,基于學生視角的問卷呈現了課堂評價行為的完整結構,消除了三類行為需要分別開發問卷的困擾,還原了課堂評價的基本面貌,為教師反思與改進自己的課堂評價行為提供參考,有利于整體洞察鮮活而真實的課堂評價狀況。
(二)正視課堂評價的整體性
通過問卷編制與調查,可以得出一個重要結論,即由三因子構成的課堂評價是不可分割的整體。通過因素分析,發現教師、學生自我和同伴的評價行為之間有著非常好的擬合性,大樣本數據的相關分析也進一步證實了這一點。也就是說,不能把課堂評價理解為三類主體的行為組合,它們是互為支持的有機體,因為一些自我和同伴評價行為往往源于教師的引導與提示,而學生作為主體的評價又會反哺教師的課堂評價。可以說,課堂評價不是單向度的教師對學生學習的評價,而是多維立體的師生共同參與的學習評價。美國教育評估標準聯合委員會(Joint Committee on Standards for Educational Evaluation)于2015年發布的《課堂評價標準》就強調了教師的課堂評價以及鼓勵學生自我和同伴評價作為一個整體對于促進學生學習的重要性。[32]國內有關促進學習的課堂評價研究也將“學生參與評價”作為課堂評價的重要策略進行討論。[33]問題在于人們對課堂評價的理解與實踐往往將三因子割裂開來對待,強化教師的課堂評價行為,弱化學生作為主體的評價,這在一定程度上削弱了課堂評價作為整體能夠發揮的“促學”“育人”功用。調查結果所顯示的學生自我評價與同伴評價水平顯著低于教師的課堂評價水平,就與上面的認識與實踐有關。如何扭轉此種困局,凸顯課堂評價的“學生參與”[34]、“整合性學本評估”[35]、“學為中心”[36]、“對人的關懷”[37],就變得緊迫與重要起來。
(三)審視課堂評價行為水平的差異性
調查結果顯示:課堂評價行為的整體水平處于“中等偏上”,內部存在水平差異。學生的同伴評價水平最低,處于“中等”水平;學生的自我評價居中,處于“中等偏上”水平;教師的課堂評價最高,處于“高”水平。細究三個因子下屬各個指標,教師課堂評價的五個指標內部有較大差異,課堂提問與測驗顯著高于其他三種行為,學生同伴評價內部也很不平衡,學生自發的同伴鼓勵顯著高于需要教師引導或指導的其他兩種行為。為什么會有這樣的差異?這可能與現實中教師過于關注自己的課堂評價,沒有很好地引導或指導,甚至忽視學生進行自我評價和同伴評價有關,畢竟學生發出的評價直接受教師的影響。此外,對于教師的課堂評價行為來說,不同于傳統評價方式的表現性評價行為得分相對較低,這說明不只是教師的認識問題,還存在教師想改善卻不知道如何做的問題。如“同伴評價需要對評價者和被評價者進行必要的培訓,才能有實際效果”[38],教師卻不知道從何入手,只是讓學生根據教師的意見進行簡單的評價。為此,需要認真思考如何有效提升教師課堂評價能力的問題,特別是那些非傳統的、學生參與式的評價技能的培養與提升。當然,提升不只是簡單的培訓式“補差”,而應該是全面而系統的,并予以制度上的保障。[39]
(四)重視學生特征對課堂評價行為的影響
從調查結果來看,課堂評價行為在性別、學段、城鄉和成績上存在顯著差異。這意味著課堂評價行為受學生某些特征的影響,需要在課堂評價實踐中因應不同類型的學生采取與之匹配的評價行為,并有針對性地優化課堂評價行為,使這些影響發揮正向作用。這就告訴我們課堂評價不能對學生“一視同仁”,而要“區別對待”,要堅持“評價的機會公平原則”[40]。同樣是課堂提問,不同性別、年級、學校、成績的學生的感知與要求不同,反饋方式與內容也應有所側重,“應考慮適合學生的背景、以往經驗和學習經驗”[41],給予學生不同的參與評價的機會。特別是在引導學生自我評價和同伴評價方面,年齡越小的學生越需要教師指導他們客觀理性對待自己的學習,因為“小學生從教師那里得到的反饋影響他們作為學習者的自我感知、他們在學校取得成功的動機以及他們完成復雜任務的愿望”[42]。如是,才能使課堂評價服務于每一個學生的高質量學習和健康成長。
參考文獻:
責任校對|董玥彤
編輯/初審|金北李
復審|王冰如
終審|安桂清
本|期|回|顧