Google Gemini 2.0 登場:原生圖像、音訊輸出,現已開放預覽
Gemini 2.0 Flash 在關鍵基準測試中的速度達到了 1.5 Pro 的兩倍。
在 OpenAI 向公眾推出 o1 模型後不久,Google 也在今天公開了下一代模型 Gemini 2.0 的首個預覽體驗版 Gemini 2.0 Flash。其關鍵升級點在於提供了原生圖像、音訊輸出,在關鍵基準測試中的速度達到了 Gemini 1.5 Pro 的兩倍。除此之外,它還能原生生成可控的多語言文本轉語音音訊,並能原生調用 Google 搜尋、代碼執行以及第三方使用者定義的函數等工具。
「Gemini 2.0,這是我們迄今為止最強大的模型。憑借在多模態方面的新進展,例如原生圖像和原生音頻的輸出以及原生工具使用,Gemini 2.0 使我們能夠構建新的 AI 智能體,從而讓我們離構建通用助手的願景更進一步。」Google CEO Sundar Pichai 在官方部落格中如此寫道。
目前開發者已經可以透過 Google AI Studio、Vertex AI 使用 Gemini 2.0 Flash 的多模態輸出和文本輸出功能,搶先體驗的合作夥伴則能率先使用原生文本轉語音和圖像生成功能。該產品將於 2025 年 1 月「全面上市」,而 Gemini 普通用戶現在也能在電腦版和行動網頁版的模型下拉選單中,選擇 Gemini 2.0 Flash 並體驗基於新模型的聊天對話。Gemini 的行動 app 很快也會跟進,等到明年初官方還會將 Gemini 2.0 擴展到更多 Google 產品中。
緊貼最新科技資訊、網購優惠,追隨 Yahoo Tech 各大社交平台!
🎉📱 Tech Facebook:https://www.facebook.com/yahootechhk
🎉📱 Tech Instagram:https://www.instagram.com/yahootechhk/
🎉📱 Tech WhatsApp 社群:https://chat.whatsapp.com/Dg3fiiyYf3yG2mgts4Mii8
🎉📱 Tech WhatsApp 頻道:https://whatsapp.com/channel/0029Va91dmR545urVCpQwq2D
🎉📱 Tech Telegram 頻道:https://t.me/yahootechhk