陳孝平、吳莉莉:1068的能與不能

出版時間:2019/03/08 00:01

陳孝平/亞洲大學特聘教授、吳莉莉/亞洲大學社會工作系研究生

愛因斯坦曾說「上帝不玩骰子」(God does not play dice)因為上帝全知全能,不需要靠機率來決定事情。但人不是上帝,對於無所知的事情就必須從母體中抽取樣本,觀察樣本的狀態來推測母體。選舉年到了,民調即將滿天飛,但從國民黨吳敦義主席也在質疑「為何由1068人來決定?」可見國人對於「抽樣統計」尚缺乏概念。

以選舉民調來說,由於其母體通常很大,因此抽出來的樣本相對於母體只是一個相當微小的比例,因此,外行人會質疑其可靠性也是人情之常。但基本上,抽樣統計是一項科學,對於合乎專業操作的民調,原則上不能輕易懷疑。

在抽樣統計中,有3個觀念相互關聯:信賴水準、抽樣誤差、樣本大小。信賴水準:指的是民調執行者容留錯誤的空間有多大。最常使用的信賴水準是95%,也就是,在100次的預測當中,容許5次錯誤;「抽樣誤差」,指的是純粹由於所抽出來的樣本不同而產生的出入,在選舉民調中通常設定為3個百分點;第三個概念是樣本大小。

由於這3者相互有所關聯,因此任2者決定了之後,在以特定母體為對象時,另一個也就決定。只是這個所需的最低樣本的大小,會隨著母體的大小而變動。以前述的95%信賴水準以及3個百分點的抽樣誤差來說,如果在1萬人當中抽樣,需要抽出964人(母體的9.64%),如果母體是100萬人,需要抽出1066人(母體的0.1%),母體是1000萬人,需抽出1067人,僅佔母體微乎其微的比例,即使到了2300萬人,也只需抽出1068人,而且即使母體再大,所需要的樣本也還是1068人,毋須再增加。

如果兩位候選人實力相當接近,3個百分點的抽樣誤差就可能無法預測勝負,如要縮小抽樣誤差,就要增加樣本數:如要精確到2個百分點的誤差,在台灣樣本要達到2401人,再精確到1個百分點的誤差,樣本數就要高達9604人。在台灣的選舉民調中,超過2000人的所謂「大樣本」民調,偶有所聞,但接近1萬人的樣本則似乎沒有(畢竟很花錢),所以,去年台北市長的選舉,柯文哲與丁守中的得票率僅有0.23%的差距,難怪所有民調都無法預測勝負。

民調既然容許5%的錯誤機會,像1948年美國總統選舉(杜魯門與杜威)民調預測的摃龜,也就是原本就可能發生的事,但這不表示民調不可靠。

當然,以上所談的是民調科學的那一面,實際上還有一些因素使民調失準。技術面來說,最主要的是取樣不夠隨機,因此無法代表母體;再來就是情境因素,例如民調的問項是否刻意使用引導式的問法;另外,台灣的民眾已經被教育成十分懂得採取「策略性」的應對,刻意造成讓對方弱勢候選人出線的機會,這就是民調非科學的部分了。

民調既然同時具有科學與非科學的性質,「民調是死的,人心是活的」的說法也有些道理。

本新聞文字、照片、影片專供蘋果「升級壹會員」閱覽,版權所有,禁止任何媒體、社群網站、論壇,在紙本或網路部分引用、改寫、轉貼分享,違者必究。

下載「蘋果新聞網APP


有話要說 投稿「即時論壇」
更多

《最新》

新聞