政事觀察站

到底是大數據還是拜天公

2015年8月5日上午3:55

並非用大數據三個字包裝的就是正確，就是領先，數據是中立的，要怎麼扭曲是你家的事，但是拿來對自己加油打氣，小心打氣過頭搞不清楚真正的狀況了啊！

【作者：朱學恒－低階酸民代表】

選戰又要到了，很多關於用大數據預測人們投票模式的說法及報導又跑出來了，聽起來很炫，但真的是這樣嗎？

先讓我們來看看維基百科上關於大數據的定義：

大數據（英語：Big data或Megadata），或稱巨量資料、海量資料、大資料，指的是所涉及的資料量規模巨大到無法透過人工，在合理時間內達到擷取、管理、處理、並整理成為人類所能解讀的資訊。在總資料量相同的情況下，與個別分析獨立的小型資料集（data set）相比，將各個小型資料集合併後進行分析可得出許多額外的資訊和資料關聯性，可用來察覺商業趨勢、判定研究品質、避免疾病擴散、打擊犯罪或測定即時交通路況等；這樣的用途正是大型資料集盛行的原因。

的確，大數據在很多可以輕易確認的結果（有沒有犯罪，有沒有消費）逆推之下，是可以分析出趨勢來的。譬如說如果當局願意公佈犯罪時間、犯罪件數、犯罪種類，套上地圖位置，就可以得出所謂的犯罪熱點，甚至是分析出對民眾來講何時在機率上比較有可能安全的在那個區域行走而不會遭遇到危險。

但是，若是要用在模糊的搜尋行為上，目前的大數據的工具就不夠先進了。原因很簡單，所謂的搜尋其實只是一種對某某事物感到好奇的行為，但這個好奇所代表的是正面或是負面，或者代表支持或是反對，除非有人開發出跟人腦一樣的分辨軟體，否則根本無法判斷。我曾經參加過某個公司的專案（相信現在還是很多公司這樣做），他的媒體分析就是把每天報導的媒體剪報拿下來，一張一張計算，有時加上媒體加權、版面加權，最後用工讀生人眼閱讀之後，判別這篇報導整體到底是正面還是負面，替這個報導加上一個正負號，最後把整個月的數據統計出來加總，就得出一篇報告。

是的，你沒看錯，是工讀生。但即使是工讀生，所做的也比當時的電腦，和現在的電腦要好。因為語意分析就是這麼困難：爸爸這麼有錢，「好好喔~~~~」、這麼努力能夠獲得大家照顧，「真是太好了~~~~」。不要說是電腦了，就算是人類，在沒有看前後文的狀況之下，你能夠只從「」內的文字看出正面或是負面，酸人或是稱讚嗎？

所以這篇報導顯然完全沒有搞懂大數據的真正概念（或者是它有別的想法哈哈）「據香港中評智庫大數據中心日前完成的大數據分析，在一定時間裡，洪秀柱的媒體聲量達54%，領先蔡英文8個百分點之多。在自媒體（指如BBS、部落客等個人媒體）部分，洪秀柱的網民提及度達55.6%，比蔡英文高出11.2個百分點。而自媒體中的意見領袖對蔡英文及洪秀柱的提及度相差較大，洪秀柱的提及率為91.7%，遠高於蔡英文的50%。」

也就是這原始文章的引用者（我查過中評智庫的原文並不是這樣寫的）天真的以為美國大亨川普（Donald Trump）在發表了墨西哥人都是強暴犯小偷之後，引起舉國譁然，各意見領袖爭相批評嘲笑諷刺，這是一種媒體聲量和自媒體的領先？川普的謀士會跳出來說真是太好了，這樣我們最近領先希拉蕊非常多，遠高於她50%？

簡單下個結論就是，並非用大數據三個字包裝的就是正確，就是領先，數據是中立的，要怎麼扭曲是你家的事，但是拿來對自己加油打氣，小心打氣過頭搞不清楚真正的狀況了啊！

中天新聞網
「北區最美大藥頭」43歲熟齡婦開400萬賓士落網　警驚為天人：保養好
桃園市平鎮區一名43歲葉姓女子，近日因販毒遭警方逮捕，由於保養得宜，甚至還被辦案人員稱做是最美藥頭。據悉，她平時都以Benz豪車代步並送毒，豪車型號及價格也曝光。
Reactions530
TVBS新聞網
早期女藝人「只有她」翻紅？　全場認證：神一般的奇蹟
不少早期出道的藝人，至今在觀眾粉絲心中還是占有一席地位，最近就有名網友表示，曾經很紅的男藝人，如張學友、偶像團體5566，現在若是出現在螢光幕前，還是能夠翻紅，反之女藝人就漸漸被淡忘了，除了王心凌以外，其他人都很難再有熱度。
Reactions94
三立新聞網 setn.com
林美秀結婚10年曝喜訊！和老公產出愛的結晶　多次感動哭到不行
記者鄭尹翔／台北報導影后林美秀出道37年跨界當歌壇新人展「演而優則唱」實力底蘊，輕吟以自己母親為名的首支個人單曲〈來春〉一唱入魂，首支單曲就獻給天上的媽媽，當中的關
Reactions10
Zeek玩家誌
熱血加乘！Hyundai Tucson L N Line售價109.9萬在台上市
Hyundai性能品牌N Brand近年來多次在WRC賽車運動、TCR及24小時耐久賽取得勝利，Hyundai汽車將其致勝關鍵應用於新世代造車的性能操控，打造日常即能享受熱血駕馭樂趣的車款，N Brand起源韓國南陽研發設計中心，在紐柏林賽道進行嚴酷測試調校，造就品牌市售車款與生俱來的賽道熱血基因。總經銷南陽實業今日在台發表Tucson L Ｎ Line，提供「極地白」、「都會灰」、以及N Line專屬「性能藍」車色，售價新台幣109.9萬元上市，將賽道基因融入生活，滿足「性能控」車迷們對駕馭本質的追求。
三立新聞網 setn.com
獨家／遭爆婚變淨身出戶！「最美童星」楊佩潔證實離婚　導火線曝光
記者蔡維歆／台北報導童星出身的38歲楊佩潔2021年跟圈外男友登記結婚。如今震撼宣布離婚，她母親節前夕發文跟媽媽喊話：「接下來是我最難熬的時期了⋯⋯很抱歉，原以為可
Reactions44
今日新聞NOWnews
藍營第一槍！他批徐巧芯洩密　要求道歉
[NOWnews今日新聞]國民黨立委徐巧芯爆料外交部援助烏克蘭，遭外交部提告洩密，立法院副院長江啟臣說，立委處理機密要小心，但他也說，立委職責是監督，不樂見行政部門對立委提告。國民黨新北市議員呂家愷說...
Reactions623
今日新聞NOWnews
揭韓國瑜和游錫堃差別　她曝這人快邊緣化
[NOWnews今日新聞]立法院長韓國瑜上任後，一舉一動都備受關注，加上他積極展現國會改革決心，因此人氣再度暴漲。對此，國民黨立委柯志恩大讚韓國瑜盡忠職守，笑虧立法院副院長江啟臣已快被邊緣化了，並比較...
Reactions18
風傳媒
00940換股安全名單？投信狂掃這5檔成分股
00940（元大台灣價值高息ETF）換股名單將於今（10）日盤後揭牌，投信今日加碼買超台股，共計買進59.77億元。觀察前10大買超，...
Reactions8
TVBS新聞網
贊成嗎？傳蔡英文將特赦陳水扁　網路投票「破8成表態」震撼
總統蔡英文8年任期即將畫下句點，卸任前夕傳出有意特赦前總統陳水扁，已經由幕僚單位啟動相關配套措施。消息一出引起朝野譁然，府方表示現階段立場是確保陳水扁的健康照護，依法規辦理；陳水扁方面暫無正面回應。針對特赦議題，最新網路投票顯示高達8成5持反對態度，輾壓超過贊成的意見。
Reactions448
壹蘋新聞網
國民黨團決議「不出席賴清德520就職」　藍委直言不滿這件事
【記者蘇柏銓／台北報導】準總統賴清德520就職倒數，國民黨團書記長洪孟楷今證實，當天是星期一，立法院也有委員會進行，因此黨團會在立法院作公務，意即藍黨團將不會出席賴清德就職大典。
Reactions511
FTNN新聞網
可望領部長級年薪？傳林飛帆入國安會任職　網讚替代役之光！
[FTNN新聞網]記者盧逸峰／台北報導準總統賴清德5月20日就職倒數10天，目前內閣部會首長及國安團隊成員均已敲定，然而總統直屬的國家安全會議，除秘書長宣佈已...
Reactions141
三立新聞網 setn.com
不甩汪小菲！大S牽手具俊曄散步信義街頭　網見背影羨慕了
娛樂中心／梁雪婷報導台灣女星大S（徐熙媛）與中國商人汪小菲離婚後，二人的風波未停歇。汪小菲更是數度擅闖大S豪宅，還派出警察和律師到場堵人，從大S住處搬走4幅高價畫作
Reactions39
TVBS新聞網
余苑綺千萬遺產「恐已被敗光」？尪全身名牌月花20萬裝闊
余天女婿、余苑綺老公Gary陳鑒近日因涉嫌當詐騙集團車手頭被捕，傳出余苑綺留下的千萬遺產，恐怕因此被當犯罪所得扣押。然而有余家友人爆料余苑綺過世後，Gary全身名牌花錢如流水，遺產怕是早就被敗光！對此，《TVBS新聞網》致電李亞萍未獲回應。
Reactions70
TVBS新聞網
「最美王后」產後首次公開露面！情緒潰堤痛哭　背後真相曝光
不丹王后吉增佩瑪去年底才為王室剛生下第三胎小公主索南·楊登·旺楚克（Sonam Yangden Wangchuck），取名象徵「美德幸運、如珍貴寶石」寓意。被國際喻為「最美王后」的她，特地將產後首次的公開露面，獻給了代表不丹角逐今年奧斯卡的新片《不丹沒有槍》的「首映會」，更邀請首相一起欣賞。
Reactions3
壹蘋新聞網
50歲陳德容第二春？離婚5年依偎眼鏡壯男慶生　透露「很幸福」
【黃詩淳／綜合報導】被譽為「瓊瑤首席女星」、「玉女始祖」的陳德容，2019年和地產小開老公王贊策離婚，恢復單身的她生活過得愜意，這個月初她過50歲生日，並曬出和友人慶生合照，不過令人好奇的是，她和一位穿白衣的男子關係似乎不一般，讓外界都猜測是她的新歡，不過她尚未對此做出回應。
Reactions27
今日新聞NOWnews
呂家愷傷到徐巧芯道歉了？徐狠回這1句話
[NOWnews今日新聞]國民黨立委徐巧芯近日公開外交部送交立院的援助烏克蘭密級文件部分內容，遭外交部提告，北檢也已分他字案，將徐巧芯列為被告。日前國民黨議員呂家愷就直言「這題連拗都不能拗，建議徐巧芯...
Reactions171
中時新聞網
徐巧芯慘了？媒體人揭北檢「法律見解」：會被起訴
外交部對國民黨立委徐巧芯提告洩密罪，徐巧芯秀出捷克外交部國際期刊表示，早在3月份就已經揭露相關資料，這份資料不應該是密件。戰略專家林廷輝表示，外長吳釗燮提告徐巧芯是殺雞儆猴，因為先前外交部已經發生太多次機密外洩問題，剛好徐公開密件、自己送上門。資深社會記者林裕豐也說，該案交給北檢的黑金檢肅小組承辦代表檢方已經有心證，徐等於是被丟進絞肉機裡，就算無罪都會被扒掉一層皮。
Reactions159
三立新聞網 setn.com
余天女婿不堪疑早有跡象！媒體人「揭他怪異行徑」爆：恐是一場局
娛樂中心／綜合報導資深藝人余天女婿Gary（陳鑒）涉嫌詐騙引發軒然大波，昨（8）日週刊又爆料余天與李亞萍夫婦在余苑綺過世後，想讓外孫就讀家附近的學校就近照顧，反被Gary獅
Reactions61
TVBS新聞網
不甩熊霓！胡瓜遭爆為新歡離婚　丁柔安私下狀態曝光
「綜藝天王」胡瓜去年爆出和啦啦隊女孩熊霓有曖昧關係，不過後來女方有男友破解傳言，沒想到又被傳出和女星宋羽葤也有親密關係，甚至因此要和丁柔安離婚，對此，胡瓜今（9）日出席「真愛秀·藍寶石大歌廳」記者會，他強調跟丁柔安感情很好，完全不受影響。
Reactions40
鏡週刊Mirror Media
余天女婿爆「敗光余苑綺3000萬遺產」　李亞萍痛心：我的綺綺真可憐
余天女婿陳鑒涉詐被逮，不但被爆在余苑綺過世後性格突變，月薪明明3萬但裝闊穿名牌、換車，更高攀富少圈等等，最新消息傳出余家原本擔心余苑綺的3,000萬遺產會因詐騙案而沒了，結果根本早早就被陳鑒給敗個精光。此外，余苑綺她弟余祥銓也揭發陳鑒與陳家私下的真面目，至於遺產一事媽媽李亞萍也回應了。
Reactions198

其他人也在看