音樂比賽 詭異的評分

【時間】2013-08-07 •【分類】數學音樂 •【作者】魔旅士

家裡的小朋友參加一場音樂比賽 (music contest), 比賽結束了, 但是我腦中留下幾個詭異的疑問.

音樂比賽的評分系統

首先, 來看看一個有趣的數字問題 : 音樂比賽的評分系統, 準不準?

音樂的競賽是很不容易評分的, 一首經典的搖滾不一定會比不上古典的曲目. 很多時候, 可愛美好的小曲子反而能比經典的大部頭名曲更能讓人欣賞心動. 而高超的技巧卻可能會成為輸家, 相反的, 弱者卻可能奪得名次. 怎會這樣哩?

我的感受來自於發現小朋友的音樂比賽評分有詭異的現像, 讓我們看看一份成績單 (這是一份隨機抽取的真實範例).

score-study-2013-02a

音樂比賽, 一份隨機抽取的真實範例: 總成績標準差只有1.1分! 而造成這種詭異成績分布的原因是評審採用打安全牌的手法. 值得注意的是: 評審2號,3號,5號,6號, 這四位評審的評分標準差只有0.6~1.2之間(紅字), 真是嚇死人的詭異.

成績單中, 有七位評審針對二十一位參賽小朋友評分. 讓人吃驚的事實是: 最高分與最低分竟然只差距4.3分!? 我不禁懷疑是我的直覺有問題, 還是這些評審都擁有”精密”評分的神奇能力.

這場比賽採用的評分方式是: 七位評審評分, 先剔除最高與最低, 剩下的五個得分, 取平均成為總成績. 因此, 可能會發生的狀況是: 很認真將好壞高低鑑別出來的評審, 很容易因為分數給太高或太低而會被剔除在外. 反而是如果評審混飯吃, 全部把分數都評成平均經驗值, 這種大鍋飯成績卻會列入正式計算公式中. 真是詭異無比啊!

統計學的觀點: 標準差 = 鑑別度 = 評審的功力

很明顯的, 如果評分的標準差值 (standard deviation)很小, 表示評審認為競賽者水準一致. 相反的, 如果 評分的標準差值很大, 表示評審認為競賽者水準差異明顯, 很容易鑑別高下. 所以, 我的直覺是, 標準差值很小的評審採用 play safe 的策略, 心中先想一個過去比賽的平均成績值, 然後隨便加減給一兩分, 這樣不會出錯, 大家面子都掛得住. 也就是說, 有評審光明正大的混飯吃.

依據這次的經驗, 我得到一份詭異的音樂比賽心得:

詭異的音樂比賽心得

(1) 普通比賽只有第一名有意義, 第二名以後都是參考. 【頂尖原則】
(1) 認真評分的評審, 對於選手排名辨識度並沒有幫助. 【反淘汰】
(2) 打混評分的評審, 有時反而成為決定名次的人!! 【反淘汰】
(3) 別太認真看待普通等級的音樂比賽, 那可能是變相的營利事業.
(4) 把重點放在上台經驗, 對於小孩子的個人收穫將會更多.
(5) 成績的標準差 = 鑑別度 = 評審的功力. 【統計學的威力】

詭異背後的道理: 通常是人性

我相信人類世界中的詭異現像; 詭異, 常常都是有深遠道理的, 也通常都能反映出人們忽略的真理. 思考之後, 我覺得可能造成這種成績分布的原因可能有:

(1) 音樂比賽的營利性質: 要營利就要有廣大的客群, 並讓顧客高興.
(2) 音樂比賽的面子特性: 評審的分數遭到”調整”, 讓家長面子掛得住, 也避免爭議.
(3) 評審的專業與面子: 單一音樂裁判如果與最終結果不同, 是不是有一種不專業的風險? 因此, 專業能力低的評審也只好假裝一下, 採用打安全牌的評分策略, 安慰心虛的自己說: 反正不會有人去分析分數的啦!!

所以, 一場標準不容易精確制定的比賽, 很容易會變成一場考驗, 一方面考驗主辦單位, 一方面也考驗參賽者的價值觀.

因此, 魔旅士的詭異心得就是: 詭異現像背後的道理, 通常就是赤裸的人性.

Latest posts by 魔旅士 (see all)
【分類】數學音樂 • 【標籤】

MORRISJFWONG / 採用 Wordpress 架設