選戰大數據(3)

文/鄭自隆

傳統社會調查因有百年的研究經驗,因此涉及的研究倫理與風險大都被排除,但大數據分析是新興研究取向,可能有侵犯隱私(privacy)的顧慮,以及「垃圾進、垃圾出」(GIGO:garbage in、garbage out),或是更嚴重的「誤用誤判」問題。

很多大數據的著作都會提到隱私權的問題,但所謂「隱私」是個人資訊被揭露,「隱私」包含空間隱私與私密隱私;「空間隱私」是個人生活私密領域可自主控制免於被侵擾的主張,「私密隱私」是個人資料的自我揭露之決定權,換言之即《個人資料保護法》開宗明義第一條所謂的「避免人格權受侵害」;「侵犯」指的是財產、工作、安全可能的威脅,甚至造成身心的不愉快都算是。

但大數據所呈現的研究結果都是「集體現象」,不會涉及單一個人資訊之揭露,如呈現「住在台北市信義區支持A候選人的觀眾,晚間9至10時大都看X台談話節目」,這是「集體現象」,並不會回溯探究信義區忠孝東路某門牌某先生的收視行為,沒有特定指涉,因此應無侵犯個人隱私之虞。

所謂的GIGO則涉及研究品質,與大數據方法論較無直接關係,大數據是近年興起概念,研究方法並無定規,因此相同資料庫交給不同研究者,由於學養視野與關照點不一樣,因此會有不同結果,所以若有「垃圾進、垃圾出」的現象也就不奇怪。

但GIGO會牽涉到「誤用誤判」問題,這屬應用決策,因此要由使用單位擔任把關與守門,所以決策者應回歸需求與經驗判斷,不迷信不盲從所謂「大數據專家」的研究結論,畢竟要實務運用的是使用單位,直接負成敗責任的也是使用單位,而不是「大數據專家」。

「大數據」如何運用於台灣選戰?2020年大選,大數據用於網友貼文聲量分析或文字雲分析,都是單一現象或單一變數(variable)的檢視,但大數據的選戰運用不應狹窄,還有很大的空間,譬如:支持A政黨或候選人的理由是X,而Y與X有關,當Y改變,支持理由X是否也改變;如X是「國家主權」,Y是「經濟成長」,當經濟持續成長,國家主權當然重要;但若經濟無法持續成長甚至停滯,是否願意犧牲主權以換取溫飽,從而改變對A政黨或候選人的支持?

這種「先顧肚子,再顧佛祖」或「只顧佛祖,不顧肚子」的大哉問,從傳統社會調查是問不出結果的,但從大數據分析卻是可以,所以選戰大數據分析就是要處理這樣的大哉問,只關注單一事件網友的聲量分析就是「大數據」,劃錯重點了。

本文為作者評論意見,不代表《台灣數位匯流網》立場

圖片來源:取自pikist、TDC NEWS製作

更多台灣數位匯流網報導
選戰大數據(1)
選戰大數據(2)

【專欄評論文章.非經授權禁止轉載】