Meta又開源AI模型,算盤打的是「AI元宇宙」!ImageBind如何帶來多感官體驗?

當各大科技公司在AI人工智慧的戰場上各顯身手,試圖占據AI市場的一席之地時,有個看似沉寂許久的科技巨頭,看似把未來押在虛擬世界「元宇宙」而錯失了先機,卻正在迎頭趕上,不斷推出、甚至開源自家的AI研究成果──那就是Meta。

Meta於5月9日宣布了一個新的開源AI研究項目,名為「ImageBind」,且不只可以生成文字、或是圖片,還可以串聯起文本、聽覺、視覺數據、3D深度資訊、溫度、動作數據。這可能將是虛擬世界「元宇宙」計畫的一大步,也代表未來AI的走向,將會是創造身歷其境的多感官體驗。

雖然這還在研究階段,Meta近期也還稱不上高調,但也不斷公開自家的研究項目,與相較之下越來越神秘的OpenAI和Google形成強烈對比。

延伸閱讀:塗鴉怎麼變動畫?Meta開源「AI繪圖專案」,超簡單5步驟立刻動起來

人工智慧「多模型」型態,將是生成式AI的趨勢?

早先廣為人知的生成式AI如Midjourney、Stable Diffusion和DALL-E,都是在訓練階段時就已經把文字和圖片「連接」在一起的系統,在訓練時,這些模型就會以文字敘述來尋找視覺資料中的模式。目前其他生成聲音或是短片的生成式AI也是如此。

但Meta表示ImageBind模型連結的不只文字和圖片,還包括了溫度(紅外線影像)、3D深度距離、還有用慣性測量裝置(inertial measuring unit,IMU,可在手機或智慧手錶中追蹤螢幕轉向等活動)所取得的動作數據。

這個模型將預期的成果是: 模擬人的感知 ,用有限的數據來生成複雜的場景。如果未來能夠搭配虛擬實境設備使用,ImageBind不僅可以生成感官效果,還可以在使用者所在的站台或座椅環境生成動作或效果。例如:輸入「長途旅行」,ImageBind可能就可以讓你置身於搖晃的甲板,讓你聽到海浪聲,並給你陣陣涼爽的海風。

元宇宙  metaverse 圖/shutterstock
元宇宙 metaverse 圖/shutterstock

Meta也在官方部落格指出,未來其他感覺數據也會添加到模型當中,例如觸覺、嗅覺和大腦fMRI信號等。文章中也指出,這個研究讓AI生成模型「更接近人類在許多不同形式的資訊當中,同步、整體且直接的學習。」

不過,這都還只是研究項目,目前都沒有實際的應用成果或消費者心得。不過,繼去年9月Meta低調推出短片生成AI模型後,這個研究項目在未來,也可能會是Meta元宇宙大夢的重要里程碑。

Meta早就是AI老手?大方開源AI研究,能搶先訂下標準?

儘管低調,人工智慧在Meta早就已經是旗下Facebook或Instagram貼文與短影音的幕後關鍵。用戶在Instagram上看到的所有內容中,就約有40%是由AI推薦的,而Instagram和Facebook兩個一起算的話,比率則是20%。在業務方面,Meta的主要業務──銷售廣告,也是AI來操盤的。

Meta在AI領域的最大優勢之一,就是旗下的研究部門,許多專家認為,Meta團隊的競爭力並不輸Google和OpenAI等同行。

延伸閱讀:AI、虛擬世界我全都要!祖克柏加碼提新概念「AI代理人」,那是什麼?

雖然Facebook和Instagram大量使用AI,但Meta的應用程式都不允許人們創建新內容,如文本或影像。外媒《Vox》指出,可能跟Meta長期被控「散播仇恨言論、錯誤訊息」的罵名有關,Meta還不想倉促建立一個會產生更多有害或是不正確內容的工具。

其實,Meta已經嘗試過了,他們去年11月所發布、以學術論文進行訓練的實驗性AI工具「Galactica」吐出了不符合事實的種族主義訊息,在三天內就被撤下了。

Meta 圖/Canva
Meta 圖/Canva

Meta同時也面臨硬體設備難以執行人工智慧系統的問題。去年9月,Meta內部發布的一份備忘錄表示,該公司「在AI開發方面,工具、工作流程和製程方面存在重大差距」,並且需要「在這方面進行大量投資」。

不過,Meta的人工智慧研究部門仍定期發布公開的AI研究論文(不包括社群媒體演算法的AI)。其他AI公司,如Google和OpenAI因競爭而不那麼願意公開研究成果。

Meta執行長馬克.祖克柏就曾表示, 公開研究成果可以讓Meta率先制定AI產品開發的行業標準,並讓外部開發者更好地融入Meta的生態系統 。今年2月,Meta的研究部門與研究人員就開放LLaMA的大型語言模型給AI社群索取使用權限。

LLaMA的能力目前落後於OpenAI最新的GPT4模型以及Google的Bard,但開放資源仍然代表著AI研究社區不須強大的電腦,就可以修改底層程式碼。但這也有專家認為,過於自由的開放可能會遭到惡意使用。

延伸閱讀:Meta要改名成「MetAI」?祖克柏過度沉醉AI世界,分析師發出警告

資料來源:The VergeengadgetVox

責任編輯:林美欣

更多報導
研究:元宇宙將貢獻美國經濟7600億美元!祖克柏的元宇宙有希望了?
ChatGPT怎麼顛覆工作?Meta、微軟都是領導者?高盛完整AI報告,4大重點一次看
塗鴉怎麼變動畫?Meta開源「AI繪圖專案」,超簡單5步驟立刻動起來