趁ChatGPT當機？Google推Gemini 2一次看

曾子軒

2024年12月11日上午7:30

ChatGPT全球大當機，讓許多愛用AI的人哀嚎不已。一些網友也發現，或許可轉用最強敵手Google才剛推出的新模型Gemini 2.0。大師吳恩達曾預言，AI 代理（Agent）將是下一波大趨勢。Google在本週宣布旗艦模型Gemini進入第二代，更新上的最大重點，便是今年下半年的熱門詞彙Agent。Google執行長皮蔡表示，Gemini 2.0將開啟全新的「代理時代」（Agentic era），不只能夠理解多變的世界，還能夠主動執行任務，像個真正的助手那樣為你完成工作。Gemini 2.0 如何使用？官網在哪？也在此文詳解。

「過去一年裡，我們投入於開發更具有代理能力的模型，⋯⋯更理解周遭世界、提前多個步驟思考，在人的監督下採取行動，」Google執行長皮蔡（Sundar Pichai）介紹Gemini 2.0之前，如此描述推進模型的背後願景。

從聊天、對話，一路進化到提升生產力，這次Gemini的更新，Google的主線則是AI Agent，希望能夠離AI Agent幫助人類的理想更近一步。

Google在今年5月的I/O大會上介紹Project Astra，這次（12月）推出Gemini 2.0強推Agent能力，便是先前鋪墊累積出的成果。取自Google YouTube。

Gemini 2.0的最大重點，就是AI Agent

「Gemini 2.0的效能更為強大，」Google DeepMind 產品管理總經理多西（Tulsee Doshi）如此開場。或許是因為所有基礎模型的發佈會上，都會聽到對於模型表現的種種宣稱，多西很快將重點拉回最重要的AI Agent上。

雖然AI Agent喊聲震天，但很多應用仍在概念驗證階段，Gemini 2.0試圖挑戰這個現狀。

從被動提供協助，到自主採取行動，這是AI助手（assistant）與AI代理（agent）的最大差異，但兩者之間的鴻溝並不容易跨越，想要符合AI Agent的定義，要有辦法制定計畫、具備記憶力，又可以調用工具，並且能夠感知環境，發展成產品還有回覆速度和運算成本等挑戰。

可整合Google搜尋是加分

多西強調，Gemini 2.0專為代理時代打造，在推理能力上有所提升，有辦法處理更複雜的任務，也加進工具使用的能力，例如整合Google搜尋、執行程式碼；此外，在理解環境上，作為原生的多模態模型，可以產出文字、聲音與圖像，且將更多編輯與控制權交給開發者。

同時，Google也持續推進對長文本的追逐，還有降低模型回覆的延遲、處理複雜指令並提升規劃能力等。值得注意的是，Gemini 2.0還支援影像串流、即時音訊，將有機會顛覆更多現有商業場景，尤其是涉及客戶服務的領域。

作為底層模型，想要發揮其功力，關鍵還是把Gemini 2.0部署到Google的產品之中，Google將會從本週開始，在Google的生成式AI搜尋功能AI概覽（AI Overview）中測試Gemini 2.0，藉此應對更複雜的搜尋意圖。

「如果說Gemini 1.0的重點是組織與理解資訊，那麼Gemini 2.0的重點就是讓這些資訊變得更加有用。」皮蔡對AI的想法始終沒變，他沒有淌入AGI到來與否的渾水，把目光放在如何讓AI幫上忙，而開發者和消費者正在等待他的話語兌現。

Agent 用在哪？Google 也攻網路瀏覽、程式開發

面向開發者與消費者的Gemini，背後有基礎研究團隊努力向前。以研究型專案Project Astra（星辰計畫）來說，Google試圖讓人看見他們是如何將抽象的AI能力，轉化為生活中的應用。

「Astra的核心原則就是讓Agent有了眼睛、耳朵和聲音後，能夠『看見』這個世界。」參與Project Astra的Google DeepMind 產品群經理徐碧波分享。

這次Google展示與Claude電腦使用（computer use）功能相似、能夠瀏覽網路的Project Mariner（航行者計畫），因為能夠閱讀網頁上的文字、圖片等資訊，因此更容易根據使用者指示完成工作。

Google同時還嘗試了陪伴人們玩遊戲的AI Agent，以及程式開發協作工具Jules。

因為Agent的多模態理解能力提升，可以看懂玩家的遊玩畫面，因此可以陪伴玩家，甚至提供策略建議。

Google原先就有程式碼撰寫助手Gemini Code Assistant，本次則進一步更新。取自Google官網。

就類似GitHub Copilot的Jules來說，已經與GitHub整合，因此開發者能夠在軟體開發過程中與之協作。舉例而言，工程師辨識出某個專案裡的待解的大量問題，或者有不少程式碼需要修整，這時就可以派出Jules自主訂定計畫，修正並處理這些程式碼，平常人類能夠監控進度，最後Jules提交成果後再審查程式碼。

支援Gemini，Google也推第六代TPU

為了支援Gemini 2.0的訓練與運算，Google也正式推出第六代TPU Trillium。Google表示，Trillium在訓練效能、推理吞吐量和能源效率方面都有提升，Gemini 2.0便是以Trillium訓練而成。

「Agent的確是個流行語，但我認為大家都意識到我們有大型語言模型，現在每個人都在試圖找出它能為用戶做些什麼，」徐碧波表示，現在LLM能夠藉著加強的推理能力採取行動，也串接外部工具，Google以網頁擴充功能亮相的Project Mariner，就是嘗試讓LLM幫上人們的方向之一。

當眾人都在探索Agent的落地應用，坐擁多元產品與大量用戶的Google從先天就有優勢。不過，從研究沈澱為產品功能需要時間，而Gemini尚且不是市場中最亮的一顆星，在這場極限生存戰中，Google還會往哪些方向邁進？所有人都睜大雙眼，看這位科技巨人，如何迎接新創和其他巨頭們的兇狠襲擊。

Gemini 2.0哪裡可以用？

若想體驗Gemini 2.0，即日起（12/12）開發者已經可以透過企業生成式平台Vertex AI、測試環境Google AI Studio：https://aistudio.google.com/

取用測試版（Gemini 2.0 Flash Experimental）。

讓開發者測試不同模型與指令的Google AI Studio上，已經有Gemini 2.0 Flash測試版可以選擇。取自Google AI Studio對話頁面

一般使用者則能夠在Google的對話式AI服務Gemini（與模型同名）：https://gemini.google.com/

選擇Gemini 2.0使用。只要打開對話頁面，點開左上角模型版本的下拉式選單，就能找到上面寫著「最新實驗版本」的Gemini 2.0。

面向消費者的Gemini除了預設的Gemini 1.5 Flash，也能見到測試中的Gemini 2.0 Flash。取自Gemini對話頁面

EBC東森新聞·
手機插飯店USB孔！秒跳出詭異訊息內行解釋了
手機插飯店USB孔！秒跳出詭異訊息內行解釋了
三立新聞網 setn.com·
LINE推出新功能！一次看懂訊息重點　用戶親測大讚：超實用
LINE是目前多數人都在使用的通訊軟體之一，今（13）日LINE官方部落格表示，最新版本14.20.0有許多新功能，其中一項是可以透過符號強調訊息重點，字體除了能加粗以外，還能變成斜體字、也可以將顏色改成紅色，讓閱讀起來更加清晰有條理，不少用戶在實測後紛紛表示「超實用」。不過官方說明，為了讓用戶享受更好的體驗，正在進行調整優化，目前暫時將該功能隱藏，調整完成後正式上線。
Reactions1
EBC東森新聞·
iPhone 17外型流出！「這1處」改動最大網：是在抄襲Pixel？
iPhone 17外型流出！「這1處」改動最大網：是在抄襲Pixel？
Reactions5
TVBS新聞網·
iPhone17設計流出！鏡頭疑改「相機島」　激似谷歌Pixel
蘋果公司（Apple.inc）預計在2025年推出的iPhone 17系列手機，外觀設計可能會有重大改變，有中國媒體爆料，從供應鏈流出的物料照片顯示，iPhone 17的後置鏡頭模組將從目前的直向排列改為橫向凸起的「相機島」，外觀與Google Pixel 9系列手機相近。不過目前還不清楚這項改動是針對整個iPhone 17系列，還是僅鎖定部分機型。
Reactions8
鏡週刊Mirror Media·
YouTube TV又要漲！每月多收324元　7年來已漲2倍以上
YouTube TV訂閱用戶注意了！月費即將再次上漲。YouTube宣布，從2025年1月13日起，該服務的基本方案價格將上調10美元（約新台幣324元），從每月72.99美元（約新台幣2,372元）漲至82.99美元（約新台幣2,697元），對於現有用戶將從該日期的第一次帳單開始生效，對新用戶則是立即生效。
Reactions3
數位時代·
Yahoo網路安全團隊大裁員25%，「紅隊」整組砍光！發生什麼事？
Yahoo近期對其網路安全團隊進行裁員，約25%、50名員工受到影響。Yahoo一系列動作似乎是該公司重新定位和精簡業務的一部分。
Reactions2
CTWANT·
法規限制又不想修改設定　蘋果將在歐盟地停售iPhone 14
[周刊王CTWANT] 根據《9to5mac》報導指出，目前蘋果還在販售的舊款機型包括第三代iPhone SE、iPhone 14和iPhone 14 Plus。按照原本的銷售計畫，iPhone 14和iPhone 14 Plus應該會在歐盟市場持續銷售至2025年秋季，屆時隨著iPhone 17的推出，iPhone 14系列將自然地退出產品線。但根據歐盟的規...
中時新聞網·
LINE推新功能秒看訊息重點用戶實測讚：超好用
LINE又將推出新功能，用戶更新LINE到最新版本14.20.0後，將來可以透過符號把訊息的字體變成粗體、斜體或改成紅色，強調訊息重點，閱讀起來更清晰有條理，許多網友測試之後直喊超好用。不過官方表示，為了讓用戶享受到最完善的體驗，正在進行調整優化，目前暫時將該功能隱藏，調整完成後正式上線。
卡優新聞網·
3C年末促銷超狂降價　5G資費配手機折2千元
搶攻年末換機潮，透過網路門市申辦5G資費就抽萬元購物金(圖/中華電信提供)
電腦王阿達·
OpenAI 宣布 ChatGPT 正式登入蘋果 iOS、iPadOS 和 macOS 系統
今年九月份蘋果發布會上除了公布自家的 AI Apple Intelligence 以外，蘋果還公布未來 OpenAI 的聊天機器人 ChatGPT 將整合到 iPhone、iPad
鏡週刊Mirror Media·
ChatGPT會視訊了！直接回應手機拍攝內容　還有耶誕老人語音一起過節
OpenAI今（13日）宣布，ChatGPT進階語音模式迎來兩項重大更新，即時視訊通話和螢幕共享上線，還有一個節慶驚喜「聖誕老人語音」，讓使用者在佳節氣氛中，體驗更人性化的人工智慧。
聯合新聞網·
蘋果升級AI 鴻海、廣達沾光…法人看好有助完備生態系
蘋果11日宣布最新作業系統整合ChatGPT，iPhone、Mac電腦、iPad等硬體AI功能大升級，法人看好有助完備蘋...
Yahoo Tech·
Nokia 5G 360 Camera 是他們「重返」專業級領域 360 相機市場的新產品
Nokia 近期推出全新的工業級 360 相機 Nokia 5G 360 Camera，屬全球首款支援 5G 的 360 相機，更可透過 5G 網絡實現超高解像度全景影片串流。
Yahoo Tech·
Apple 也為 Pages、Numbers 及 Keynote 加入支援 Apple Intelligence 功能
Apple 為 Pages、Numbers 及 Keynote 帶來 Apple Intelligence 功能，令大家使用以上應用程式工作時也可以得到 AI 的幫助。
美國之音·
間諜行動還是戰爭行為？涉華“鹽颱風”震撼美國政壇
疑似受中國支持的網路間諜活動“鹽颱風”(Salt Typhoon)近日席捲了美國政壇。過去兩週，美國國會連續就此事舉行了兩場閉門簡報會和一次聽證會。有美國專家說，攻擊美國的基礎建設，這樣的行為已經超越了普通的間諜行動，可以算是“戰爭”行為。美國議員已經提議就此立法，提高網絡的安全性。
Reactions1
中央社·
埃及最早成立電信服務商Orange (圖)
Orange是埃及首家取得行動網路電信服務的業者，成立於1998年，更名前為Mobinil。
今日新聞NOWnews·
2025全球資安威脅預測　專家示警6大趨勢
[NOWnews今日新聞]Fortinet近日發布最新《2025全球資安威脅預測》報告指出，威脅者將採用更大規模、更大膽的手法，將其攻擊鏈專業化、強化特定攻擊環節，同時發展更具針對性、更複雜的結合虛實...
壹哥的科技生活·
vivo X200、X200 Pro 真實使用心得｜質感外型、夠猛的演唱會長焦、更長的使用時間
去年 vivo X100 Pro 為智慧型手機市場帶來讓人印象深刻的長焦演算法，落日旗艦讓我可以在高美濕地輕鬆拍出比任何手機都還要好看的暮色。而如今，作為 vivo 公司 2024-2025 旗艦機代表，vivo X200 系列在我長時間使用之後，我會覺得是全方位的升級，效能更強、讓人印象深刻的長焦實力，堪稱新一代演唱會神機。
Reactions1
數位時代·
Google推出Android XR平台！XR裝置Project Moohan明年上市：有望打趴Vision Pro？
Google推出最新作業系統Android XR，與三星合作開發代號為Project Moohan的首款頭戴式裝置裝置，預計明年上市。
TVBS新聞網·
林襄被指是「搶高鐵位、態度囂張」女星　黃小柔全說了：大家不訝異
女星黃小柔和Vicky上小S《小姐不熙娣》，控訴有後輩坐了Vicky的高鐵位置不讓座還滑手機冷回「那邊還有空位」，態度讓Vicky當場怨「現在的小孩怎麼這麼沒禮貌」，因關鍵「流量很大」，加上小S反應，讓網友辦案瘋猜是之前一起上《綜藝玩很大》的林襄和林穎樂。今（14）黃小柔和陳為民、綠茶出席她首次擔任監製及編劇的短劇《網紅崛起》媒體探班，被問是否在講林襄，黃小柔全說了！強調：「不管網紅或是在哪一圈希望大家還是秉持著要有禮貌、要有家教。」
Reactions20

Gemini 2.0的最大重點，就是AI Agent

可整合Google搜尋是加分

Agent 用在哪？Google 也攻網路瀏覽、程式開發

支援Gemini，Google也推第六代TPU

Gemini 2.0哪裡可以用？

其他人也在看