Llama 3.1 是 Meta 最新銳的開源模型

這個新模型有 4,050 億個參數,可望加強數學運算、程式編碼及推理能力。

Mark Zuckerburg Meta
Mark Zuckerburg Meta

Meta 在周二宣布推出其大型語言模型的最新版本「Llama 3.1」, 該公司宣稱其可以與 OpenAI 和 Anthropic 的競爭產品相媲美。 此模型的推出,距離 Meta 將 Llama 3 整合到聊天機器人 Meta AI 僅僅三個月的時間,但這當中包括 OpenAI 和 Anthropic 都發表了新版的 AI 模型,讓 Llama 3 一下就顯得過時了不少。由此可見這輪 AI 的「軍備競賽」有多激烈。

Meta 表示,新模型的全稱為為 Llama 3.1 405B,當中「405B」代表著它有 4,050 億個參數,通常參數愈多,模型也就愈「聰明」。做為比較,OpenAI 的 GPT-4 模型據稱擁有大約 1.5 兆個參數,但 OpenAI 迄今尚未披露確切數字。Llama 3.1 使用超過 16,000 顆 NVIDIA H100 GPU 進行訓練,號稱是首個可與競爭對手在一般常識、數學計算和多語言翻譯方面相競爭的開放式模型,且能在 150 多個基準測試中勝過競爭對手。此外,Meta 還發布了現有 Llama 模型的升級版本,分別包含 700 億和 80 億個參數,並聲稱較新版本具有更強的推理能力。

開發人員可以從 Llama 3.1 的官方網站上下載模型;而普通用戶則可以通過 WhatsApp 或 Meta 的聊天機器人網站 meta.ai 進行體驗。不過要注意的是,目前,Facebook、Messenger 和 Instagram 上的 Meta AI,仍然僅使用擁有 700 億參數的輕量版 Llama 3.1。Meta 的部落格文章指出,Llama 405B 強化的推理能力,讓 Meta AI 能夠理解和回答更加複雜的問題,尤其是在數學和撰寫程式等方面。

與 OpenAI、Google、微軟和 Anthropic 等將其 AI 模型保密不同,Meta 的 AI 模型是開源的,這意味著任何人都可以免費修改和使用它們,而無需與 Meta 共享個人數據。Meta 首席執行官 Mark Zuckerberg 在周二發表的一封信中稱,採用開源的方式進行 AI 開發,將能確保社會更廣泛地享受這項新技術的益處,並防止少數大型公司壟斷。Zuckerberg 並寫道,通過開源 Meta 迄今為止最大的語言模型,其目標是讓 Llama 成為任何人都可以用來開發 AI 應用與服務的「業界標準」。

Zuckerberg 在信中還順便批評了蘋果及其封閉生態系統,並直指其平台的高度限制性及獨斷的政策,限制了 Meta 可以在其平台上構建的東西。 他寫道,「很明顯,若是我們的競爭對手無法限制我們所能構建的東西,那麽 Meta 和許多其他公司,都將能更自由地為人們構建更好的服務與產品。」

相關文章: