伟德国际比分网Edvocate’s Guide to Cut-Off Scores
一個截止得分是指學習者在考試或其他形式的評估中獲得的“及格”或“精通”的最低分數。在某些情況下,測試可能有多個截止分數表示分層的熟練程度,如基本的、熟練的或高級的。分界分也可以應用在認證和執照考試中,用來決定教育工作者和其他學校工作人員是否具有專業“資格”。
無論分界分數是由個人教育者在課程考試中設定的,還是由專家小組在大規模標準化測試中使用複雜的心理測量方法決定的,所有的分界分數都是基於個人或集體意見的知情判斷。
換句話說,截止分數是介於藝術和科學,主觀和客觀之間的連續統一體的判斷。
對於由考試公司開發的標準化考試,以及由各州和國家組織(如SAT、ACT或全國教育進展評估(NAEP))對大量學習者進行管理的標準化考試,分界分數通過一個通常被稱為標準設定(標準參照考試)或規範(標準參照考試)的過程來決定。
確定分界點
在典型的標準製定過程中,測試開發人員將通過招募一組專家,如心理測量學家(教育測量科學的專家)或相關內容領域的教育工作者,來創建一個標準製定小組。
然後,該小組將利用心理測量學家和學者開發的一種或多種基於研究的方法來設定測試標準和確定分界點。這個過程通常包括審查測試項目(問題,問題,作業),確定每個項目的難度,並利用一個統計過程,以集體意見為基礎,建立一個截止得分或者一組與“熟練程度”相對應的刪減分數。
分界點的細微差別
當教育工作者製定考試或其他作業並給它們打分時,分界點更多地依賴於個人的專業判斷。還有,用來決定的標準截止分數可以相差很大。例如,曆史先例經常被用來確定課程考試和作業的扣分。在美國,70分一直被許多學校認為是“及格”的分數,不管考試的內容是什麼,考試是如何設計的,也不管這個分數在教育成就方麵代表什麼。
同樣的70分也適用於以不同方式評估的各種評估。例如,在多項選擇題測試中獲得70分的人可能會決定利用一個簡單的數學公式——70%的問題回答正確,30%的問題回答錯誤。
然而,科學項目或書麵論文的70分可能需要對工作的內容和質量做出更細致的判斷,例如,這可能是基於單個教育者的專業意見,或基於評分指南中描述的明確標準,幾個教育者使用這些標準來評估學習者之間或課程之間的學習。
我們錯過了什麼?