Google 的一部 Gemini AI 示範影片有誇大能力之嫌
影片中看起來好似 AI 能和你即時對談,但它幾乎全是剪輯出來的。
Google 的 Gemini AI 模型是該公司對抗 GPT-4 的關鍵,不過一部名為「Hands-on with Gemini: Interacting with multimodal AI」的示範影片中,Google 似乎已經將剪輯運用過頭,有點誤導人的嫌疑了。
如果只看影片的話,我們可以看到主持人在便條紙上畫畫,然後 Gemini 就在旁邊一步一步試著猜出畫的是什麼。主持人會和 Gemini 一來一往的「對話」,Gemini 在當中也會時不時地秀一下自己的「知識」,一切都看起來非常流暢。
不過在一篇評論文中,Bloomberg 指出影片的說明裡表示,「為了縮短影片費時,有對 Gemini 的回應延遲進行縮減」,這本身就已經表示了 Gemini 其實是無法像影片中這樣和用戶即時互動。而進一步詢問 Google 後發現,Gemini 不僅不能即時判讀畫面內容,其實也沒有處理語音,而是給了 Gemini 定格的畫面,提問也是以文字進行,之後再將 Gemini 的回應與主持人的影片剪在了一起。
Google 當然是否認這裡有任何問題,並且 Gemini 的共同計畫主持人 Oriol Vinyals 表示,所有影片中的 Gemini「用戶提示與輸出都是真實的」,並且該影片的目的是為了「啟發開發者」。雖然這樣說是沒有錯,但少了影片中的即時互動感,Gemini 的驚人表現難免是要打個折扣了。
Really happy to see the interest around our “Hands-on with Gemini” video. In our developer blog yesterday, we broke down how Gemini was used to create it. https://t.co/50gjMkaVc0
We gave Gemini sequences of different modalities — image and text in this case — and had it respond… pic.twitter.com/Beba5M5dHP— Oriol Vinyals (@OriolVinyalsML) December 7, 2023
相關文章: