放言快訊 |
首頁 / 放.數據 / 放數據
放.數據
如何看待民調偏差?從地區效應到跟風效應(下)
2018.11.09
15:41pm
文 / 王宏恩
民調機構在不同的縣市會陷入不同程度的集體迷思,這樣的集體迷思,跟各選區的選戰狀況以及民眾跟風情況有關,而到底偏差多大,也要到真正開票出來才能見真章了。

 

文/王宏恩

 

在上一篇文中,我們使用2014年民調分析,發現全部民調平均而言有3.7%的泛藍偏差,但是各個民調機構的整體偏差不大,反而更重要的是各縣市。不同民調機構,在各縣市幾乎都會朝相同的方向偏差,要嘛一起偏藍、要嘛一起偏綠、要嘛一起很準。為何會有這樣的地區效應?

 



 

有兩種可能的解釋,一種就是這些民調機構會互相參考,不敢做出差太多的結果,所以就一起偏。這雖然實務上存在,但解釋力不大。更有可能的狀況,是選民在不同的選區有集體偏差,可能在泛藍的選區,泛綠選民就比較低調,而在泛綠選區,泛藍選民就比較不想回答民調。


國民黨強勢的地方民調呈現泛藍偏差 同理可證國民黨弱勢地區民調顯示朝綠
 

要驗證這樣的解釋,最簡單的方式就是把選後各選區的國民黨得票率,比較選前各民調機構的國民黨偏差比例,我就做了下面這張圖。

 


 

這個結果完全證實了我們的跟風假設,在國民黨比較強勢的縣市(分布圖右半側),無論是哪家民調機構,都顯示比較容易做出朝泛藍偏差的民調結果。但假如在國民黨比較弱勢的地區(分布圖左半側),則各民調機構都比較容易做出朝綠偏差的民調結果。

 

從圖上的線性回歸估計來說,假如在國民黨能拿到50%選票的地方,各機構選前平均會估國民黨拿到60%的票;但假如國民黨只能拿到30%的票的地方,各民調機構只會估國民黨拿到20%的票。而在國民黨大概能拿到40%的票的地方(例如台北市),則各民調機構大概就能準確估到國民黨拿到40%的票。

 

這個結果是非常明顯的。我進一步透過多元回歸模型,把估計偏差當作依變數,把各地區、各民調機構、以及國民黨最後選舉結果放進模型當自變數,結果發現當國民黨選後結果放進去後,民調機構的機構效應就完全消失了,在統計上並不存在。當然各地方還是會有一些地區性差異,但這大致上可以說是因為候選人素質、選舉風氣、競爭程度等。

 

我接著把原本的自變數估計偏差換成另一種計算方式,我不再等比例放大選前民調的泛藍跟泛綠的數字,而是單純用泛藍減去泛綠,得到『民調裡泛藍贏幾%』,然後把這數字跟選後結果裡『選舉結果裡泛藍贏幾%』,兩者再相減,得到『民調的泛藍比大選的泛藍多贏泛綠幾%』,用這數字來估計各民調機構或各地是否存在泛藍偏差。就總平均來說,這八家民調機構在選前會高估泛藍贏過泛綠多8%的票。但事後分析的結果基本上跟之前的分析都一模一樣,民調機構偏差是來自於各縣市的跟風狀況,例如在桃園跟新竹縣嚴重高估泛藍淨得票,在宜蘭高雄低估泛藍淨得票,而偏差主要不是來自於各民調機構的結果。使用回歸模型,同樣可以驗證跟風的這個假設。
 



從2014年經驗便可判定,民調機構2018仍可能高估或低估特定候選人

 

這個結果給我們對2018現在的民調跟結果有很大的啟示。現在無論是對泛藍友善或對泛綠友善的媒體或民調公司,可能都集體做出對某些候選人不利的民調,這些民調結果因為同時被泛綠跟泛藍的媒體報出來,讓大家覺得特別有公信力,彷彿這就是最終選舉結果了。

 

但從2014的經驗就知道,這些民調機構即使到了2018年,還是很可能會一起高估或一起低估特定的候選人,民調機構在不同的縣市會陷入不同程度的集體迷思,例如他們在2014的新竹縣一起高估國民黨多拿30%的票、他們在2014的桃園市一起高估國民黨多拿20%的票、或者它們一起在宜蘭縣低估國民黨5%的票等等。

 

這樣的集體迷思,跟各選區的選戰狀況以及民眾跟風情況有關,而到底偏差多大,也要到真正開票出來才能見真章了。

 


(示意圖製作-放言視覺設計部 鄭羽彤 
 

延伸閱讀