選戰大數據（1）

台灣數位匯流網 |鄭自隆

2020年7月5日下午10:00·4 分鐘 (閱讀時間)

文／鄭自隆

選戰分析研究社群媒體貼文的統計，稱之「網路聲量」，很多人都說這就是「大數據」，這是以管窺豹，但何謂「大數據」？

「大數據」是「沒有『理論』的理論」或「不理『理論』的理論」，傳統社會科學研究，會先參酌文獻（理論），假設變項之間具有「因果相關」，然後蒐集個案資料，再以適當統計方法證明或否證之；若經統計檢定呈現顯著的差異或關聯後，接著就要進一步思考或用理論檢視此個案，到底只是「統計相關」，抑或真的有「因果相關」？其佐證模式如下：理論檢索（假設）→ 統計相關（分析）→ 因果相關（結論）。

但大數據理論（Big Data）顛覆這種思維，大數據可不管第一階段的由文獻所建構的因果相關假設，而是從浩瀚的數據中，沙裡掏金，先找出2個變項的統計相關，然後再找出理由詮釋其關連，甚至不管因果關係：不做假設（沙裡掏金）→ 統計相關 → 因果相關（臆測推論）。

換言之，傳統社會科學研究是先有Why，再找出What以證明之，而大數據理論是先有What，再探究之間Why的關連，如果認為只是從網路找出很多data就是「大數據」，這是誤會，「大數據」重要的是「觀念」與創新連結，至於data是否來自網路倒是其次。

「大數據」是近年興起的概念，除上述方法論（methodology）的基本思維和傳統社會科學研究方法迥然不同外，其研究程序二者也不同：一是「樣本與母體」，傳統社會調查，樣本由母體依適當抽樣方法，以隨機方式產生，而且樣本數至少1067個，如此方具「信心水準95%，抽樣誤差±3%」的推論意義，就是以樣本的研究結果可以推論或預測母體的行為，如選戰候選人支持度調查，就可以用1067人的態度推論1900萬選民的傾向，這就是抽樣（sampling）的功力。

而大數據則是「樣本＝母體」，沒有抽樣問題，所有與研究目的可能有關的資料庫都可以是母體來源，所以是龐大二手資料所建構的巨量資料，而這二手資料庫未必是與研究直接有關，也未必是網路行為的資料庫，如何連結取用，就看研究著功力洞見，也因為「樣本＝母體」，所以沒有信心水準與抽樣誤差問題，大數據是「信心水準100%，抽樣誤差為0%」。

傳統社會調查，資料取得是配合研究目的所形成的特定調查，其資料量就是樣本數，資料格式是依研究目的事先規劃的，要形成資料化（datafication），即無論數字、文字、圖片、影像均必須符碼化（coding）－轉化為可量化計算的人工符碼，如以內容分析法（content analysis）探討候選人臉書圖片元素，可依研究目的將候選人臉書圖片區分為圖像攝影、群眾互動、使用道具等類目（categories），每一類目再建構測量標尺（measurement scale或稱indicator），如「圖像攝影」就分為大特寫、特寫、近景、全景、其他，測量標尺的建構就是「資料化」的過程。

而大數據除了資料化外，有的還必須數位化（digitization），數位化即由電腦可直接閱讀的符碼，如透過人臉辨識分析造勢活動參與者的共同特徵即是，不必經過人工的符碼化。

而資料的精確性，傳統社會調查要求「絕對精確」，這當然很難，但必須力求「相對精確」，如問受訪者每月收入多少，看似絕對精確，但也未必，本薪或許記得，但加班費與獎金是浮動的，也說不準；平均每天看電視多少分鐘、使用手機多久，這些在社會調查中常見的題目，多少都涉及信度（reliability）或效度（validity）問題，無法絕對精確，只能達到相對精確；遑論7等分或5等分的態度量表，由受訪者自我評量，請問你對A牌泡麵評價為何，今天評價5（「好」），隔一週再問可能就變成6（「很好」），要求「精確」很難。

大數據分析用的是巨量資料，要求精確更不可能也沒有必要，舉個例，台灣面積是36,197平方公里，今天隔壁填了一口井1平方公尺，我們會說今天台灣面積變成36,197.001平方公里嗎？在巨量資料中，這種微小的誤差會被稀釋，可以忽略。

本文為作者評論意見，不代表《台灣數位匯流網》立場

圖片來源：取自pikist、TDC NEWS製作

【專欄評論文章．非經授權禁止轉載】

EBC東森新聞·
周五再放一天？12縣市已達停班停課標準
周五再放一天？12縣市已達停班停課標準
Reactions92
三立新聞網 setn.com·
又在信義區！孫安佐竟與混血女星當街打起來　自豪有這項「超能力」
娛樂中心／綜合報導狄鶯與孫鵬的兒子孫安佐在泰國脫序行為之後，2個多月來各種紛爭再度成為話題人物，還曾因在信義區展示有攻擊性的武器被送入警局。台英混血歐斯卡（Oscar）在台北101
Reactions185
引新聞·
小吳終於道歉了！十盛標示不實　哽咽認了：早知道有奶精
（記者劉雅文／綜合報導）百萬YouTuber小吳和網紅紀卜心，共同創立的手搖飲品牌「十盛熟成奶茶專賣店」，日前 […]
Reactions288
三立新聞網 setn.com·
又有颱風？未來發展曝「下週2天」最接近　專家揭對台影響
生活中心／林昀萱報導凱米前腳才剛遠離，恐又有另一個颱風生成？中央氣象署指出，今（27）日受到低壓帶影響，台灣東半部及南部地區有陣雨或雷雨，並有局部大雨或豪雨發生的機
Reactions22
中天新聞網·
高雄被颱風重創卻找不到黃捷！本人出面回應網友反揪疑點：出國玩不敢說？
凱米颱風直撲台灣，而南台灣的台南、高雄等地更是被暴雨襲擊，多處出現嚴重淹水，然而此時身為高雄立委的黃捷卻不見人影。對此，黃捷本人回應「自己的團隊」從早到晚奔波，對高雄噴政治口水「大可不必」。然而網友卻發現更多疑點，怒嗆質疑黃捷到底人在不在台灣？
Reactions874
TVBS新聞網·
台北風雨小「放颱風假賺爛」？專家揭關鍵打臉：沒這事能這麼和平
颱風凱米直撲台灣，全台多個縣市一連放了2天颱風假，然而今（25）日早有民眾疑惑「北北基桃這樣放颱風假是賺到了？」、「北部風雨那麼小放什麼颱風假？」但氣象專家點出1關鍵，直言若沒發生這件事，「北部還能那麼和平嗎？」
Reactions244
風傳媒·
「高虹安是小白兔闖入政治叢林」　游盈隆預言結局：可能還有變化
新竹市長高虹安於立委任內涉詐領助理加班費案，一審判處7年4月，職務由副市長邱臣遠代理，並宣布退出民眾黨。對此，...
Reactions107
三立新聞網 setn.com·
2親人都罹大腸癌！婆婆「剩菜加1物」吃出癌　譚敦慈揭飲食3地雷
生活中心／張家寧報導大腸癌是近幾年台灣癌症的頭號話題，許多名人也都曾因該疾病身亡，對於人體健康的影響程度不容小覷，外界提到大腸癌大多會聯想到攝取加工食品、抽菸嗜酒等壞習慣。
Reactions21
中央社·
王冠閎分享奧運接駁車慘況須席地坐盼團本部安排
巴黎奧運今天舉行開幕式，接駁車問題仍然無解，台灣游泳好手王冠閎、韓安齊分享，接駁車大誤點、開錯路，加上游泳項目人數多，甚至只能席地而坐，也盼比賽日當天團本部能安排接駁。
Reactions55
中天新聞網·
想要連3天放颱風假嗎？15縣市達停班停課標準　最新雨量預測曝
凱米颱風中心點已在今（25日）離開台灣本島，但有多少人奢望明天繼續放颱風假？根據中央氣象署今天早上發布的雨量預測，一共有15縣市達標停班停課標準。
Reactions97
三立新聞網 setn.com·
強颱釀高雄淹水！陳柏惟怒轟酸民「對同胞無情、程度差」：高雄人沒欠你
記者楊士誼／台北報導颱風「凱米」侵台，造成多起災情，25日颱風出海後帶來的西南氣流造成中南部多處淹水，高雄更降下超過2009年莫拉克颱風降雨量的超級大雨，造成多處淹水、滯洪池全滿，
Reactions813
Yahoo奇摩運動·
奧運》戴資穎、孫振掌旗率隊征戰花都開幕式Lady Gaga、席琳狄翁接連開唱同慶
2024巴黎奧運會於台灣時間27日凌晨1點30分正式開幕，中華代表團搭乘第74艘船進場，掌旗官由台灣羽球一姊戴資穎及霹靂舞一哥孫振擔當，代表團共有21位中華健兒、12位教練、6位行政人員參與開幕儀式，巴黎現場雖然下起不小的雨勢，但仍舊抵擋不了大家的熱情，每位選手皆用力揮舞手上會旗，透過轉播鏡頭讓世界看到台灣。
Reactions56
新頭殼·
凱米前腳剛走又有颱風? 菲律賓附近恐有熱帶低壓生成下週逼近台灣
[Newtalk新聞] 凱米颱風暴風圈今（26）天凌晨脫離台灣本島。中央氣象署最快在今天上午8點半解除海上颱風警報，颱風尾夾帶的豐沛雨量預計會持續到今晚才會趨緩；而凱米前腳才剛走，恐怕又有颱風成形，週末菲律賓東方海面可能會有熱帶低壓生成，預計將朝台灣東南海面前進，下週一到四對台灣會影響。氣象署今天凌晨2點半解除凱米颱風本島警報，凱米颱風今天清晨5點的中心位置在馬祖的西南西方約170公里之處，以每小時16轉12公里速度，向北北西轉西北進行。氣象署預計在上午8點半解除海上警報。中央氣象署預報員陳姵安表示，凱米颱風尾帶來的豐沛雨量預計在今晚就會趨緩。陳姵安提到，週六風向改為東南風，屆時東部、屏東將會出現風場幅合效應，將會有水氣影響。另外，週末在菲律賓東方海面，可能會有熱帶低壓生成，若生成將朝台灣東南側海面前進，下週一到週四對台灣有影響。不過，目前歐洲、美國對熱帶低壓的強度預設仍有分歧，還要持續觀察。此外，氣象粉專「台灣颱風論壇｜天氣特急」25日深夜發布消息指出，目前在菲律賓東南方有一個熱帶擾動（tropical disturbance）95W正在發展，綜合歐美德及幾個AI模式大致都認為
Reactions60
三立新聞網 setn.com·
他喊1縣市完虐北中南：最宜居城市！網戰翻：天然災害真的相對少
鄉民中心／梁雪婷報導台灣各縣市因地理位置、環境設備等，遇到自然災害的損害各有不同。日前，就有網友指出，桃園甚少傳出自然災害的災情，也沒有台北土壤液化的問題，空氣也比
Reactions24
三立新聞網 setn.com·
認屍案傳回泰國　唐治平親戚不捨出手了！金援內幕曝光
記者鍾智凱／綜合報導唐治平認母案受到高度關注，日前他受訪時表示：「既然檢警堅持要我認，我就認。」先前他曾指出母親會有百萬保險金部分，他說要拿到母親死亡證明才能領，且
Reactions100
中廣新聞網·
揭發高虹安涉貪　國民黨前議員林耕仁「16字」曝心內話
新竹市長高虹安涉貪案一審判有罪，內政部宣布高虹安停職，高虹安表態將會提出上訴。揭發高虹安涉貪的國民黨前新竹市議員林耕仁今（26）天透過臉書回應：「天道輪迴、舉頭三尺、尊重司法、嚴謹判決」。高虹
Reactions174
TVBS新聞網·
根本不在台灣？黃捷發文嗆「團隊在奔波」網揪疑點：出國玩不敢說
凱米颱風尾橫掃台灣中南部造成嚴重災情，高雄慘淹大水淪為重災區。然而高雄立委黃捷卻被質疑未被到場勘災，國民黨智庫副執行長凌濤更是發文「急尋黃捷」。對此，黃捷今（26）日發文反擊，只是1句「團隊同仁」在地方奔波，再遭網友揪出疑點，質疑她出國玩不敢說？
Reactions312
FTNN新聞網·
躲股災選「它」！交易量暴增達42萬張　股價逆勢漲2.93%　網喊：歐印
[FTNN新聞網]記者蔡昀庭／台北報導因凱米颱風侵襲，台股休市2天，今（26日）開盤補跌，重挫982點，摜破22000點，最低達到21931.9點，收22,119.21點。股民為躲...
Reactions24
三立新聞網 setn.com·
凱米來襲爽放颱風假？台股休市2天沒開盤　最大苦主30億沒了
財經中心／蕭宥宸報導颱風凱米重創台灣，各縣市24、25日停班停課，台股也跟著停牌2天。股市2天未開盤，推估政府證交稅收減少約30億，且不包括證券商手續費。此外，美股迎來大幅度回檔，
Reactions133
三立新聞網 setn.com·
關鍵4個月！王義川曝新竹企業家「恐逼高虹安辭職」：辭了黃國昌選不了
記者詹宜庭／台北報導新竹市長高虹安被控涉貪助理費46萬餘元，台北地方法院今（26日）一審判決出爐，依貪污罪高虹安判刑7年4月，褫奪公權4年，可上訴；另依地方制度法第
Reactions119

其他人也在看