Google承認Gemini超神影片造假「動了幾刀」！號稱打贏GPT-4，其實很水？

數位時代

2023年12月11日上午2:56

Google於12月份的第一周野心勃勃地揭開全新AI模型Gemini的神秘面紗，除了拍攝影片大肆宣傳Gemini卓越的架構和功能，還聲稱這款模型已超越OpenAI的GPT-4等模型的性能。不過卻有人發現，Gemini的宣傳影片有造假之嫌，指出這款模型可能不像Google聲稱的那麼好。

12月6日，Google公布一段名為「與Gemini互動：和多模態（multimodal）AI互動」的影片，點閱率在一天內即突破100萬次，因為這個演示影片呈現了Gemini如何以混合語言和視覺理解的多模態AI模型，靈活地回應各種輸入的內容或指令。

延伸閱讀：Google最強模型Gemini，30項測試打贏GPT-4！Pixel 8 Pro搶先解鎖2大AI功能

大動作推出Gemini，演示影片卻陷入造假危機

儘管影片有確實載明影片中有縮短Gemini的反應時間，跳過中間的延遲和猶豫的部分，但《彭博社》的記者首先指出，這個影片並非真實的，因為實際上的「演示影片」，是經過一系列精心調整的圖像和文字提示，所歪曲而成的互動情況，不論是用戶在和模型互動的速度、準確性和基本運行模式都被影片誤導。

舉例來說，影片2:45處顯示的是，一隻手靜靜坐出一系列的手勢，而Gemini則快速回應用戶在玩剪刀石頭布，不過在Google另外提供的文件中說明，Gemini是同時看到剪刀、石頭和布三個手勢，並且在文字提示：「你認為我在做什麼？提示：這是一個遊戲」的協助下，才做出最終正確的回答。

雖然實際的互動和影片內容仍有相似之處，但兩種互動的感覺顯然有很大的不同，一種是直觀、無須言語的評估，可以即時捕捉抽象的想法，另一種卻是精心設計且高度暗示的互動，反而顯示了其侷限性。

除了演示影片的問題以外，AbacusAI執行長賓杜．雷迪（Bindu Reddy）在其X的個人貼文中分享他的觀察，雖然Google列舉許多Gemini在各種基準測試中的得分超越GPT-4，包含用於評估AI模型在STEM、社會科學、數學和人文學科等領域潛力的大規模多任務語言理解（Massive Multitask Language Understanding，MMLU）。

雷迪指出Google使用COT@32取代5-shot的機器學習方式，以增強Gemini的效能，才得以在MMLU方面的評估更加突出。但5-shot才是評估這項表現的標準衡量基準，而在使用5-shot的情況下，GPT-4的表現（86.4%）仍比Gemini更佳（83.7%）。

google gemini rock paper scissors.jpg 圖/Google

同時，也已有許多人開始試用Bard上面的Gemini「精簡版」Gemini Pro，他們發現該模型無法正確反映基本事實。例如，當問到2023年的奧斯卡最佳男主角，Gemini Pro回答的是去年的得主布蘭頓．葛利森（Brendan Gleeson），而不是真正的獲勝者布蘭登．費雪（Brendan Fraser）。除此之外，翻譯或外語似乎也不是它的強項，有人詢問Gemini Pro是否可以給他一個6個字母的法語單字，其回覆的不是7個字母就是5個字母的單字。

Google Gemini translate 圖/X @benjaminnetter

Google回應演示影片是為了激勵開發人員

隨著質疑的聲浪越來越大，Google研究和深度學習副總裁Oriol Vinyals回應，對於人們對Gemini的實作影片感興趣非常高興，他也重申影片中的所有使用者提示和輸出的結果都是真實的，只是為了簡潔而縮短。演示影片也展示了使用Gemini構建的多模態用戶體驗會是什麼樣子，Google之所以製作它是為了激勵開發人員。

不過這並非Google的演示影片第一次受到質疑，過去該公司在展示AI助理Duplex協助用戶預定髮廊和餐廳時就有過爭議。在演示過程中，Google Duplex看起來能夠協助人們預訂餐廳、預約美髮服務，甚至預訂旅行。但在幾位記者和專家的實際操作後，他們得出該演示影片的內容並非真實的結論，而是需要另外設定，因此Google Duplex的功能被認為是虛假的。

延伸閱讀：Google最強模型Gemini，背後靈魂推手揭密！Deepmind創辦人如何靠「西洋棋」成功？

參考資料：Tech Crunch、Tech Crunch、India Express、Mint、CNET

責任編輯：陳建鈞、蘇祐萱

三立新聞網 setn.com·1 天前
大二女生被王晶看上！演三部電影狂賺116億票房　如今成「最美晶女郎」
娛樂中心／綜合報導香港名導王晶執導過不少膾炙人口的電影，而且他挖掘演員常有點石成金的本事，捧紅了包括李麗珍、邱淑貞等女星，令不少嚮往加入娛樂圈的女孩子，也想搭上王晶的順風車。當中一
Reactions217
三立新聞網 setn.com·3 小時前
震央在中央山脈的地震終於還是發生了　王士豪醫師籲：別入高山「危邦」
記者李鴻典／台北報導0403花蓮強震後，大小餘震不斷，根據氣象署觀測資料，今天（4/30）17:35發生芮氏規模4.4地震、地震深度7.5公里，震央位於花蓮縣萬榮鄉；高海拔醫學權威
Reactions98
三立新聞網 setn.com·32 分鐘前
演唱會台下狂喊「林憶蓮」全場譏笑！李宗盛當眾變臉直喊：保安呢？
娛樂中心／林汝珊報導 65歲樂壇大師李宗盛「有歌之年」巡迴演唱會，上月28日在杭州開唱。不過網上流傳一段現場畫面，只見李宗盛在台上唱歌時，台下竟有觀眾狂喊他前妻「林憶
Reactions5
鏡週刊Mirror Media·1 天前
【李多慧強壓林襄3】李多慧遭爆名花有主　200公分男友「經紀人」當掩護
礙於啦啦隊女神身份，一直聲稱是單身的李多慧，去年10月曾在個人 YouTube頻道影片中，開出「理想型」男友條件，包括要顧家、相處合得來，以及接受她的個性；至於長相和年紀則沒有任何限制，認為心靈契合更重要。不過據球界人士透露，李多慧根本早已名花有主，男友正是那名在台灣總跟在她身邊的韓國經紀人。
Reactions55
三立新聞網 setn.com·2 小時前
下午新一輪雷雨開轟！雨勢趨緩時間出爐　「一週天氣變化」一圖看
記者楊晏琳／台北報導未來一週天氣主要受一波波鋒面影響。中央氣象署表示，台灣已進入到梅雨季，未來天氣較不穩定；目前各地雨勢趨穩但預估今日各地仍有雷陣雨，之後雨勢一天比
Reactions2
CTWANT·56 分鐘前
流浪漢當街「生吞活剝」　警察抵達時受害者「這2處」已被吃掉
[周刊王CTWANT] 根據《每日郵報》報導指出，整起事件發生於28日凌晨4點多，拉斯維加斯當地警方接獲通報，表示在查爾斯頓大道（Charleston Boulevard）300號附近發生鬥毆。警方獲報抵達現場後，就看到一人倒臥在地上生死不明，而捷克正在啃蝕這人臉部的器官。警方甚至發現，受害者的眼球、耳...
Reactions36
太報·1 天前
傳胡瓜烙狠話「拿3、4千萬跟丁柔安離婚」　熊霓消失《綜藝大集合》　經紀公司證實了
資深藝人胡瓜先前與小44歲的樂天女孩熊霓傳出關係親近，然而後來補教名師徐薇的兒子江大成低調承認，正在熱烈追求女方，讓胡瓜與熊霓之間的關係降溫。據週刊報導，傳聞胡瓜的「照顧名單」又新增1人，就是曾參加節目《綜藝大集合》的女星宋羽葤。沒想到，近來又傳出胡瓜因為跟妻子丁柔安出現日常爭執，胡一度講出要拿3、4千萬元跟丁離婚的氣話。
Reactions44
民視·20 小時前
張鈞甯逛地攤「厚重鏡框忘記脫」認不出！41歲近拍大臉嚇暈萬人
娛樂中心／曾郁雅報導41歲女星張鈞甯有著氣質的外貌，加上「高材生」的學業表現，自2002年出道至今，一直是粉絲榜樣，身為演技派演員的她，曾演出不少經典作品《我在墾丁天氣晴》、《痞子英雄》、《白色巨塔》等，成為不少觀眾心中戲劇女王，近日前進米蘭旅行的張鈞甯在IG分享一系列在街頭拍下素顏0偽裝的自然模樣，讓不少粉絲一見到她真實狀態都瞪大眼睛：「太美啦！」。
Reactions48
三立新聞網 setn.com·1 天前
獨家／爆拿4千萬離婚丁柔安！掰了熊霓換寵宋羽葤　胡瓜火大發聲了
記者蔡維歆／台北報導胡瓜（瓜哥）跟丁柔安今天遭《鏡週刊》報導出現日常爭執，甚至講出要拿4千萬元離婚的氣話，還傳出掰了熊霓後，新歡改寵宋羽葤。對此記者剛求證瓜哥，他火大駁斥：「你們一
Reactions91
三立新聞網 setn.com·19 小時前
戀情成真了？金秀賢「私下牽手」金智媛畫面瘋傳　網嗨：請原地結婚
娛樂中心／林汝珊報導人氣韓劇《淚之女王》28日播出大結局，以24.9%高收視率完美收官，劇組日前也開心出席慶功宴，飾演金秀賢姊姊的模特兒張允柱，昨（29日）PO出一
Reactions11
今日新聞NOWnews·21 小時前
葉元之爆吳秉叡不在場卻投票　他嗆偽造文書
[NOWnews今日新聞]立法院會今（30日）表決國民黨所提電價凍漲公決案，卻發生案外案，國民黨立委葉元之指控，在表決「停止在彰濱工業區興建晶鼎焚化爐」時，民進黨立委吳秉叡於表決時明明人已不在議場，卻...
Reactions52
CTWANT·2 小時前
割頸案國三生姊姊今生日　1原因「不知手足離世」頻問：弟弟呢？
[周刊王CTWANT] 臉書粉專「孩想陪你長大聯盟」發文指出，今天是楊姓男學生姊姊的生日，姊姊因為一些狀況，因此年紀永遠永遠停留在小時候，無法意識到弟弟的離開。印象深刻的一幕是，總召徐妮妮在初次見到姊姊的時候，對方不斷喊她的名字，接著就是問「弟弟呢？」讓她當下心如刀割，至今想起...
Reactions42
FTNN新聞網·2 小時前
外資不放過！「這檔」剛逃出中國　又被賣千張
[FTNN新聞網]記者游俊彥／台北報導台股昨（30）日終場指數收盤下跌98.92點，收盤指數20,396.6點，跌幅0.48%。昨日三大法人合計買超32.66億元，其中外資買超23...
Reactions5
今日新聞NOWnews·5 小時前
人物／吳秉叡挺一例一休　曾嗆別投民進黨
[NOWnews今日新聞]立法院昨表決大戰，藍白聯手表決勝出，通過決議建請台電凍漲電價。但民進黨立委吳秉叡繼上次表決大戰誤投票支持國民黨後，昨又被點名人不在議場卻有人代投。吳秉叡是蘇系大師兄，本屆也是...
Reactions41
中天新聞網·1 天前
5/1「媽祖生」恰逢勞動節！3生肖拜完媽祖「好運立刻到」
明天（5/1）農曆3/23也是「媽祖生」，恰逢勞動節。清水孟國際塔羅小孟老師表示，有三個生肖當天拜完媽祖之後好運立刻就到。
Reactions7
三立新聞網 setn.com·20 小時前
《淚之女王》金秀賢比海仁還有錢！88億首爾豪宅曝光　鄰居超大咖
娛樂中心／宋亭誼報導 36歲男星金秀賢出道多年，憑藉著亮眼外型及精湛演技活躍於韓國影視圈，擁有《擁抱太陽的月亮》、《來自星星的你》、《雖然是精神病但沒關係》等知名作品
Reactions3
今日新聞NOWnews·2 天前
民眾黨現新內鬥？前幕僚：柯文哲無法容忍他
[NOWnews今日新聞]有消息傳出，民眾黨主席柯文哲日前在黨團會議裡下令，要求黨內立委應深耕議題，避免民眾黨成「一人政黨」，同時也認為除重大議題共同表態外，應讓立委自主決定民生議題。對此，柯文哲前幕...
Reactions245
三立新聞網 setn.com·5 小時前
3星座下半年少動怒！不發脾氣「未來將一帆風順」
生活中心／倪譽瑋報導 2024年已經過了快一半，在12星座中，有哪些星座能以平和的情緒繼續面對下半年的挑戰？根據《搜狐網》的專欄，在2024下半年，天秤座、巨蟹座、摩羯座的人
Reactions3
聯合新聞網（運動）·1 天前
巴黎奧運／體育署喊話超越上屆奪牌難度卻更勝以往
上屆東京奧運我國代表團共拿下包括2金在內的12面獎牌，奪金數追平，獎牌數則是創下隊史新高，今年巴黎奧運儘管上屆奪牌好手幾乎都將再度參戰，體育署署長鄭世忠也喊話期待超越上屆成績，不過我國面臨的奪牌...
Reactions17
CTWANT·2 小時前
備受寵愛1／米可白喝茫緊抱男友撒嬌　孫綻一路溫柔護愛
[周刊王CTWANT] 4月19日接近中午時，米可白在社群上貼文和媽媽的溫馨又有趣互動，當天生日的她打電話給媽媽表達感謝，卻被正在烤餅乾的媽媽掛電話。不久，又貼了和愛犬在家看生物世界紀錄片，平時會帶狗出來放風的她，當天卻遲遲未出門。正以為米可白似乎打算過個溫馨平凡的生日時，傍晚近5...
Reactions52

大動作推出Gemini，演示影片卻陷入造假危機

Google回應演示影片是為了激勵開發人員

其他人也在看