放言快訊 |
首頁 / 放.數據 / 放數據
放.數據
如何看待民調偏差?不只是機構效應(上)
2018.11.05
20:50pm
文 / 王宏恩
即使真的打了千通電話、真的謹慎的使用電話抽樣,過去民調數字還是會被人質疑有「機構效應」,也就是偏藍的民調喜歡公布泛藍較高的數字、偏綠的民調喜歡公布泛綠候選人較高的數字。與其說是民調機構的機構效應造成民調失準,不如說是各個選區的特性造成各機構在各選區集體失準。

 

文/王宏恩

 

選戰進入最後一個月,由於這次選戰緊張刺激,幾乎各家民調機構都不斷公布數字,不只吸引眼球也牽動每一位選民的情緒。但於此同時,到底民調準不準?一直有人質疑民調的準確性,認為民調不過只是候選人的宣傳、候選人只有有利的時候才會公布、甚至也有造假不斷的傳聞。

 



 

機構效應:藍綠各自公布有利民調?

 

當然,大多數老牌子的民調機構負責人彼此間都是認識,甚至是同一個訓練學院出來的,這些人雖然各有政治立場,但在數字上動手腳可說是自毀招牌。但即使真的打了千通電話、真的謹慎的使用電話抽樣,過去民調數字還是會被人質疑有「機構效應」,也就是偏藍的民調喜歡公布泛藍較高的數字、偏綠的民調喜歡公布泛綠候選人較高的數字。

 

這樣的現象深植人心,但它真的是系統性存在的問題嗎?對這個問題探討很重要,因為它將會影響我們怎麼評論最近2018年的民調數字以及候選人的估票。我在稍微搜尋過現有學術界的討論後,並沒有找到滿意的答案,因此我決定在這個專欄來自行用數字進行研究,並第一次在此公布非常有趣的結果。

 

我先下載了維基百科上記錄的2014年縣市長選舉的全部民調數字與選舉結果。為了公平比較各民調機構,我只取選舉日前兩個月、以及各民調機構最後一次公布的民調數字。理論上,這數字應該是最接近選舉結果的數字,也是各民調機構最後一次喊牌。最後,在刪除只有公布一次或兩次的機構,最後一共留下了86次2014年各民調機構公布的縣市長選舉民調,由8家不同的民調機構發布的。

 

接著,我把這些民調資料跟實際選舉比較。實際選戰裡只有藍綠的得票率,但民調資料裡有為數不少的「未決定」。我把未決定捨棄,然後把民調裡的藍綠得票等比例放大到加總為一,這樣就算有機構效應或偏藍偏綠,理論上也可以偵測得出來。最後,把民調裡的泛藍比例減去大選裡的泛藍得票率,就能得到每家民調機構最後一次民調裡朝泛藍偏差多少。

 

機構效應不明顯朝藍綠偏差分布分散

 

以下是分析結果:

 

第一,這86筆民調裡面,平均而言朝泛藍大概有3.7%的偏差。相較於通常千份抽樣有3%的誤差水準來說,這樣的差距是有點大。但在同時,並不是全部的縣市、全部的縣市都是朝藍偏差的,某些縣市顯然高估泛綠得票(例如2014台南市)、某些則高估泛藍得票(例如2014新北市),所以需要更細部的分析。

 

因此,我先來比較各民調機構的偏差,驗證是否存在機構效應。下面這張圖是八個民調機構的朝泛藍偏差的程度,圖裡面中間的虛線則代表該機構準確預測結果。

 


 

這張圖裡有幾個發現。首先,幾乎所有的盒鬚圖都包含了虛線,除了中國時報以外。而且許多民調機構的偏差中位數很接近虛線,包括世新大學、民進黨、趨勢等。因此大致上來說,平均而言,各機構的機構效應並沒有很明顯。就算是在部分縣市朝泛藍嚴重偏差的台灣指標民調,它在其他縣市也對泛綠嚴重偏差,因此整個分布是很分散的。當然,大多數的機構的中位數全都大於零,除了自由時報以外。

 

各民調機構偏差方向及數量與各縣市呈現一致

 

接著,我們來以縣市為單位,看看各縣市的民調偏差。

 


 

當我們以各縣市作為觀察對象時,一個重要的現象就出現了:各縣市裡各民調機構的偏差方向跟數量是非常一致的!假如某家民調做出極度偏藍的結果,另一家民調也會做出差不多的結果(例如左邊數來第4個的新竹縣)。假如某家民調很準,其他民調也會跟著很準(例如右4的台北市跟右6的台中市)。

 

從上面兩張圖來比較,我們與其說是民調機構的機構效應造成民調失準,不如說是各個選區的特性造成各機構在各選區集體失準。

 

那我們是否有辦法解釋各個選區的失準原因為何呢?我將在下一篇專欄繼續分析,並說明這對2018大選有甚麼啟示。

 

 

(示意圖製作-放言視覺設計部 鄭羽彤

 

延伸閱讀