聲量大,當選機率高?(1)

文/鄭自隆

2020年選舉,無論總統或立委候選人都在拼網路聲量,真的網路聲量大,當選機率就會高?

當然不是,網路聲量是呈現網友針對單一事件(event)或議題(issue),對候選人的吐槽或贊聲,除非候選人有本事持續製造正向話題,形成風潮,讓選民從單次短暫認知,轉化成長期正向態度,如此方有助於支持率提昇,否則網路聲量只是偶而一現的曇花。

從學理上可以瞭解,網路聲量和選舉時對候選人支持度的調查不同;在方法上,選舉民調的受訪者是隨機(random)、被動被抽取,所謂「隨機」是指母體中的每一個體都有均等被抽中機會,而且意見表達僅有一次,其意見不會重複被計算。

但網路聲量統計不是,先不說是否被操弄,網路聲量是意見表達者的主動發言,既沒有母體概念(網友不代表所有選民),也沒有隨機,誰都可以主動發言貼文,而且不只一次,意見可重複表達,每次意見都列入聲量計算,這也是網軍可系統性「作票」、帶風向的原因。

再從內容來看,網路聲量常受特定事件(方法論稱為History)影響,換言之是網友對特定議題或事件的發言,也就是當下直覺的意見與態度表達,因此當民進黨陳明文在高鐵掉了裝滿鈔票的「一卡皮箱」,或是國民黨立委衝撞外交部發生「夾手他人」與「見縫插珍」,這時陳明文、陳玉珍、黃昭順的網路聲量就會爆增,不過這都不代表支持度也增加。

選舉民調問的是對候選人的支持度或喜好度,除非有特殊的考量,如想要瞭解選民對突發性事件或議題的態度,否則民調就會避開「特定事件」可能影響期間,也就是說選舉民調,調查的是選民長時間蘊釀形成的對候選人整體印象,因此若使用Panel Study(小樣本連續性調查),的確更可觀察選民長時間對候選人態度的變化,不過網路聲量調查若針對Panel觀察恐無意義。

再從標尺(scale)設計來說,選舉民調會明確詢問「支持誰」或「誰最適合當總統」,網路聲量固然也有分為正向、負向、中性三種標尺,但不是由網友自行表態,而是由研究者根據語義分析(semantic analysis)設計的測量標尺,交由「機器人」AI判讀,將貼文依其文義歸類為正向、負向或中性,但問題是網路語言千變萬化而且推陳出新,難以捉摸,如「用選票下架○○○」與「用新台幣下架義美豆漿」,同樣是「下架」但意義截然不同,當源頭(標尺語義設定)出問題,後面產出的分析當然就會受到挑戰,換言之網路聲量語義分析的標尺效度(scale validity)會受到質疑。

本文為作者評論意見,不代表《台灣數位匯流網》立場

圖片來源:取自pikist、TDC NEWS製作

更多台灣數位匯流網報導
Kuso玩選舉
丞相,起風了!

【專欄評論文章.非經授權禁止轉載】