全民查假會社》看懂民調:總統大選民調賴清德第一?學者:假帳號恐影響結果

全民查假會社》看懂民調:總統大選民調賴清德第一?學者:假帳號恐影響結果
全民查假會社》看懂民調:總統大選民調賴清德第一?學者:假帳號恐影響結果

【愛傳媒全民查假會社專欄】《菱傳媒》於6月14日發佈總統民調系列1-6,結果顯示,賴清德以37.76%的支持度大幅領先,柯文哲31.29%居次,侯友宜21.87%墊後。而詢問台灣民眾對兩岸發生戰爭的感受,43.74%的民眾擔心兩岸3年內一定會或可能會發生戰爭,另有57.61%民眾認為美國一定會或可能會出兵協防台灣。

學者指出,民調詢問3年內存在的兩岸戰爭風險擔憂有多高,「3年」為主觀設定,本題如果改為問「在2024蔡英文總統卸任前」、「若某總統候選人當選,在其任期內」等客觀「時間階段」,則其答案應有更多可觀察、比較、分析之處。

此外,調查使用DMP (Data Management Platform)數據管理平台操作,DMP為廣告投放與追蹤系統,會將來自同一網站、同一ID(名稱)的帳號合併,但對多重帳號並不處理,因此,愈喜歡在網路上帶風向、回應問卷、擁有愈多假帳號的人,愈容易被抽中,故存在「假帳號」的問題與隱憂。

本次解讀民調報告如下:

解讀日期:2023年6月20日

民調日期:2023年6月6日至10日

民調主題:2024總統大選網路民調

報導機構:風傳媒、公視新聞網、中時新聞網、三立新聞

執行機構:《菱傳媒》委託皮爾森數據負責執行,並由台大政治系張佑宗教授協助問卷設計與調查顧問。

調查地區:全台各縣市

樣本/誤差:針對全台灣年滿20歲以上之網路人口,有效樣本為1萬2030份,在95%信心水準下,抽樣誤差為正負0.89%以內。

民調摘要:《菱傳媒》委託皮爾森數據進行「2024總統大選」網路民意調查,於6月14日發佈總統民調系列1-6,結果顯示,賴清德以37.76%的支持度大幅領先,柯文哲31.29%居次,侯友宜21.87%墊後。相較於上月《菱傳媒》針對這三位候選人所做的民調,三人排名一樣,賴的支持度略降,但柯的支持度則從21.74%暴衝到31.29%,首度站上3成。而詢問台灣民眾對兩岸發生戰爭的感受,43.74%的民眾擔心兩岸3年內一定會或可能會發生戰爭,另有57.61%民眾認為美國一定會或可能會出兵協防台灣。

爭點解讀:

一、民調詢問3年內存在的兩岸戰爭風險擔憂有多高。設定為「3年」的背景與原因未清楚說明,此處將風險與擔憂一併詢問,是否不夠周延?

二、民調詢問受訪者,如果台灣跟中國發生戰爭,美國會出兵協防的機會有多高。此處並未清楚說明美國「出兵協防」的具體作為,是登島作戰還是保衛台灣海峽不被封鎖等,受訪者的想像影響答題準確程度?

三、民調使用網路調查方法與結果解讀之爭議處?

四、有關DMP中假帳戶的隱憂。

專家分析:

世新大學資訊管理系前主任吳統雄解讀:

本案特色為使用DMP (Data Management Platform)數據管理平台操作。

DMP為廣告投放與追蹤系統,可以投放廣告,當然也可以投放問卷。使用階層可分為3級:國內外系統開發營運商、數位行銷商、與代客操作商。

DMP不具備民調基本功能,國內外主要系統開發商,均未建議作為民調使用。

爭點一解讀

本爭點的關鍵在測量理論中的「時間階段設計」。

坊間民調幾都採用主觀設定,如本案之「3年」。或經常將受訪者的年齡以10年、20年畫分。這種主觀設定,經常使得變項之間沒有區別力、也沒有觀察意義,統計術語稱為「關聯性」;甚至可能掩蓋了原始有區別力的變項。

本研究者發現「時間階段設計」若與關聯變項配合,便可反映出區別力。

譬如在公共事務調查上,早期發現:以「臺灣光復」分期,後來以「戒嚴解除」、或「李登輝總統直選當選」分期,就出現區別與意義。在生活型態調查上,以「就業前後」、「結婚前後」、「子女誕生」分期,都會產生觀察意義。但以上若採用主觀的10年、20年畫分,經常沒有區別力。

故本題如果改為問:

「在2024蔡英文總統卸任前」、「若某總統候選人當選,在其任期內」等客觀「時間階段」,則其答案應有更多可觀察、比較、分析之處。

爭點二解讀

本爭點就是2個民調基本觀念的混淆,第一、「形象測量」或「深度測量」(請參見2022.12.19/ 2023.05.02《看懂民調》對的解說),與第二、「假設性條件句與真實條件句」(請參見2023.05.31/ 2023.01.05《看懂民調》對的解說)。

本案正如本問題所描述,沒有謹慎處理這2大工作,結局就是出現「形象數字」,欠缺可分析的深度。

爭點三解讀

本案可稱經過網路的便利調查,若嚴格定義,並非「網路民調」。

DMP為廣告投放與追蹤系統,擁有非常龐大的名單,來源為「三方匯集」,俗語就是大雜燴。

第一方是自己客戶的名單,第二方是協力廠商的客戶名單,除非自己是非常龐大的公司,以上兩者相加都相對有限。

DMP主要就是第三方、尤其來自社媒、與各會員網站的名單,譬如臉書使用者名單,便是各主要DMP的共同子集合。

使用臉書的人都知道,臉書上充斥假帳號,與重複帳號,個人可能有數十個分身,而職業網軍不乏有數千個帳號者。

DMP會將來自同一網站、同一ID(名稱)的帳號合併,(本案用了「網路行為分析帶入使用者輪廓標籤」對一般人難懂的名詞。)但對多重帳號並不處理,因為DMP的目標是投放廣告,很多活躍消費者喜歡用不同帳號買不同商品,DMP更希望擁有這樣消費者的所有帳號。

DMP會依據預算抽出投放對象(即樣本),而預設不是平均抽出,而是活躍者、過去消費(即回答、點閱)愈多者愈優先,亦即DMP目標就是要抽出「偏頗樣本」。

因此,愈喜歡在網路上帶風向、回應問卷、擁有愈多假帳號的人,愈容易被抽中。

當然,這個預設是可以重設與修改的,唯本案並未說明是否處理,以及如何處理。

本案宣稱:「全台灣年滿20歲以上之網路人口…有效樣本為1萬2030份,在95%信心水準下,抽樣誤差為正負0.89%以內。」

DMP非常龐大,更由於多重帳號關係,有的甚至超過總人口數。但不使用社媒、不登錄為網站會員的人口也不少,就不會在DMP中。故「全台灣年滿20歲以上之網路人口」一句並非事實。

其報告之「抽樣誤差」數字是由「二項分配」而來,如果問題只有2個答案,倒是沒錯;但本題有5個答案,是為「五項分配」,其誤差數字就是錯的。更重要的是,DMP是個非隨機/非等機率資料庫,以上誤差的估計根本是無意義的(請參見2022.08.08《看懂民調》對「抽樣誤差」的解說)。本案另採用沒有因果關係的「加權法」,只是美化數字,可能反而擴大誤差(請參見2022.10.06《看懂民調》對「加權法」的解說)。

一般坊間民調均不能夠推論為代表全臺灣民眾的意見。但只要其樣本仍具分散性,只要沒有作假,可以代表所訪問到的樣本。故可以作為「統合分析meta-analysis」的來源資料之一,再加上更多方位的知識與歷史經驗整合,仍然有可能觀察出一些真實趨勢。

唯本案目前的呈現,可知不具備隨機/等機率,可能具備偏頗性、無法得知其是否具備分散性,故暫時不宜列入可參考名單。其對三位總統參選人支持度變化的解讀…等,就以一句俗話視之:看看就好,毋需評論。

爭點四解讀

DMP中包括臉書「假帳號」的問題,為彭百顯(國展基金會董事長,前立委、南投縣長)、鍾琴(「數位言論自由論壇」總召集人、前新聞局長)與本人(臉書「全彩論壇」管理員)長期關注,並在2020年與時為政務委員、管理數位產業的唐鳳對談,在會中由唐委員提出了「臉書演算法不透明」的事實共識。

由於臉書總部的宣示就是「透明」,所以我們經由唐委員多次與臉書中央與地方連絡,表達願意溝通合作、並以民間力量免費為臉書提供解決「假帳號」的技術。臉書中央有一次回應、但無行動,地方則完全置之不理。

本專欄為全民查假會社「看懂民調專案」之報告,全民查假會社官網網址為:https://tstm.tw/

●專欄文章,不代表i-Media愛傳媒立場