Google展示名為「Project Astra」的通用人工智慧數位助理,部分功能將率先用於Google服務

Google I/O 2024開始前,Google曾預告類似Google Lens的應用功能,確定為以「Project Astra」的發展項目,將能結合語音互動、影像識別、環境感知等方式,讓人工智慧即時描述、解釋以手機鏡頭拍攝畫面內容,甚至也能無縫移轉到具備攝影鏡頭功能的眼鏡上繼續使用。

Google展示名為「Project Astra」的通用人工智慧數位助理,部分功能將率先用於Google服務
Google展示名為「Project Astra」的通用人工智慧數位助理,部分功能將率先用於Google服務

「Project Astra」是由Google DeepMind團隊構思打造,並且以通用人工智慧數位助理形式為目標,讓使用者能透過此服務提高工作效率、簡化做事流程,並且以此解決日常生活的疑難雜症。

不過,目前「Project Astra」仍處於相當早期發展階段,暫時尚未有具體成為正式產品或服務計畫,但Google DeepMind團隊負責人Demis Hassabis表示「Project Astra」相關功能將會應用在手機或眼鏡類智慧穿戴裝置,甚至部分功能將會在今年內率先應用於Gemini等Google服務。

Google展示名為「Project Astra」的通用人工智慧數位助理,部分功能將率先用於Google服務
Google展示名為「Project Astra」的通用人工智慧數位助理,部分功能將率先用於Google服務

從此次Google I/O 2024實際展示來看,「Project Astra」將能透過手機鏡頭拍攝畫面,並且由人工智慧即時地持續描述畫面細節,例如描述擴音器可發出聲音,甚至指出其中可發出高音頻的擴音元件,或是描述以蠟筆為題的創意疊詞、辨識程式編碼內容,甚至針對白板上畫的貓與紙箱聯想到「薛丁格的貓」等。

此外,從影片中使用者另外提到是否記得眼鏡位置,人工智慧即可快速回答眼鏡所在位置,代表其具備資訊記憶能力,同時也能隨著使用者從手機切換到使用具備鏡頭攝影功能的眼鏡,更代表「Project Astra」具備一定資料遷移特性,讓使用者能在不同裝置上持續使用。

而Demis Hassabis表示目前已經可以透過多模設計讓「Project Astra」的人工智慧處理諸多訊息,但要能讓回應時間縮短至與一般對話相仿,其實是相當困難挑戰。

更多Mashdigi.com報導:

Google揭曉代號Trillium的第6代TPU,加速Google Cloud平台應用服務執行效率

Google擴大升級Gemini人工智慧模型,新增Gems功能、推出全新開源模型Gemma 2

Google將更多Gemini功能帶到Workspace服務,新增名為AI Teammate的團隊協作助理