【專欄】民進黨總統初選民調的科學性

民進黨總統候選人初選辦法經過一番折騰,蔡英文總統透過派系運作,強行在現有的市話民調加入手機、各佔50%,終於將要展開。根據黨中央的說明,市話是以一年前中華電信住宅電話簿為抽樣母體,涵蓋760萬戶,以末兩碼隨機抽樣;手機抽樣母體則是以國家通訊傳播委員會所提供上一季2,900萬用戶,以末五碼隨機抽樣。實際操作是由五家民調機構各抽樣3,000份,分別由蔡英文及賴清德與韓國瑜及柯文哲三腳督對比,由兩人的平均支持度決定勝負。

一份民調是否精準,關鍵在於樣本是否以隨機的方式產生,換句話說,是否母體中的每個人都有相同被抽中的機會,而非一個人不會被抽到兩次。民進黨秘書長羅文嘉表示,手機被抽到的機率是萬分之五(0.0005)、市話是千分之一點九(0.0019),因此即便是擁有兩、三支號碼,不管市話或手機被重複抽中的機率都相當低。這樣的說法,大致上符合早先某學者的論點,卻禁不起科學的驗證,畢竟,學術界普遍對於手機民調保留,尤其是母體究竟是什麼無法確定。

就2,900萬支手機的抽樣而言,即使我們可以剔除外國人、或20歲以下的國人(假設120萬人),保守估計,應該起碼有900萬選舉人擁有兩支手機,他們被抽到的機率是別人的兩倍,整體的樣本就已經不能算是隨機產生的了。以男生當兵完成受訓後的抽籤來做比喻,假設本島與外島的籤是二比一,我們可以想見,抽到「金馬獎」的機率相對上只有一半。因此,一般在實務上的作法是依據市話結果,對於可能遺珠的年輕選民進行加權,手機只是對照參考用。

隨機抽樣被破壞無遺

除了對於手機母體的質疑,我們必須指出,民進黨採取市話與手機各半,原本的出發點是想要探詢223-250萬純手機族的意向,卻平白讓1,400萬左右同時擁有市話、及手機的選民增加一倍抽中的機率,相對上不利於純市話(43萬)、或是純手機族,換句話說,所謂的隨機抽樣完全被破壞無遺。我們打個比方,一種顧胃的新藥要是可能會傷到肝,當然在試用初期要戒慎小心。蔡英文陣營要求100%手機、後來自動減半,表面上是阿莎力,顯露的是無知的傲慢。

有一種說法是,五家民調機構總共抽樣15,000份,應該可以降低誤差。我們知道,在要求95%的信心水準(confidence level)下,通常只要隨機抽樣1,067份,就可以確保正負3.0%的抽樣誤差(margin of error)。單一民調機構下,當樣本數增加到3,000份,誤差可以降到1.789%,要是繼續再增加到15,000份,誤差是正負0.8%。問題是,五家民調的平均數,應該只能算樣本數3,000份的微調(畫素提高),而非真正的單一機構樣本提高(畫質提高)。

以民進黨2011年總統提名初選民調來看,不看許信良,蔡英文與馬英九對比的平均支持度是42.50%、蘇貞昌是41.15%,相差0.35%,不管當作五家各抽3,000份的平均、或算是15,000份,其實都在誤差範圍內。關鍵還是在抽樣是否隨機,也就是說,儘管相機的畫素、或是畫質大量提高,要是鏡頭老是拍到容易出現者、抓不到要拍的稀有對象,特別是在走動的車子上(環境變動),還是面對害羞(拒答)、或冬眠(不投)的選民,不知道意義何在?

順便一提的是,有些機構近日所公布的民調,或許是受限於委託單位的經費,便宜行事,市話與手機只各做了534份湊數,兩邊的誤差高達正負4.24%,不是加總夠1,067份、就以為可以達到3.0%的要求。有興趣的讀者,可以參考Margin of error calculator(https://www.surveymonkey.com/mp/margin-of-error-calculator/、或是https://goodcalculators.com/margin-of-error-calculator/)。總之,由初選到大選,還有很多因素,然而,觀微知著,對知識的輕蔑絕對不利治國。 專欄屬作者個人意見,文責歸屬作者,本報提供意見交流平台,不代表本報立場。