蘋果AI終於來了！誠意滿滿 4種版本開源生成式 AI 模型 OpenELM

鉅亨網新聞中心

2024年4月25日上午1:00

蘋果 (AAPL-US) 因在生成式 AI 領域的腳步太慢，遭微軟、OPenAI、Google 等科技公司狠甩幾條街，即使執行長庫克表示，今年稍晚就會有生成式 AI 的新進展，仍無法挽回部分投資人信心，今年迄今股價仍跌逾 12%。如今，蘋果總算有生成式 AI 的新舉措。

為了在加速生成式 AI 的發展，蘋果在開源 AI 平台 Hugging Face 上發布一個具有開源訓練和推理框架的高效語言模型，名為 OpenELM。

據了解，OpenELM 有四種尺寸：2.7 億、4.5 億、11 億和 30 億個參數版本，定位於超小規模模型，而微軟 Phi-3 模型為 38 億。這種小模型運行成本更低，可在手機和筆記型電腦等設備上運行。

同時，在 WWDC24 開發者大會之前，蘋果徹底開源了 OpenELM 模型權重和推理程式碼，資料集和訓練日誌等。而且，蘋果還開源了神經網路庫 CoreNet。

早在今年 2 月，庫克就表示，蘋果生成式 AI 功能將於「今年稍後」推出，有消息稱即將在 6 月發布 iOS 18 可能是蘋果 iOS 史上「最大」的更新，而 9 月也將推出首款 AI iPhone 設備。

如今，蘋果似乎在新一輪 AI 浪潮快到尾聲的時刻追趕上了產業腳步。

隨著 ChatGPT 風靡全球，近幾個月來，三星、谷歌、小米等手機廠商全面推進大語言模型在手機、平板等端側上的使用，包括照片處理、文字處理增強等，並形成一大賣點。而蘋果很少透露且極少有類似的自備功能，主要是用第三方工具做到類似效果。

今年 2 月財報會議上，庫克首次公佈生成式 AI 計劃，並將在今年稍後將 AI 技術整合到其軟體平台（iOS、iPadOS 和 macOS）中。

庫克表示，「我只想說，我認為蘋果在生成式 AI 和 AI 方面存在著巨大的機會，無需透露更多細節，也無需超出自己的預期。展望未來，我們將繼續投資於這些和其他將塑造未來的技術。其中包括 AI，我們繼續在 AI 領域花費大量時間和精力，我們很高興能在今年晚些時候分享我們在該領域正在進行的工作的細節。」

事實上，自年初至今，蘋果在生成式 AI 領域動作不斷。今年 3 月，蘋果技術團隊發表論文《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》，首次披露蘋果大模型 MM1，涵蓋 300 億參數、支援多模態、支援 MoE 架構，超半數作者屬於華人。

如今，針對手機、平板等端側領域，蘋果真正的開源模型終於來了。

根據論文顯示，蘋果開源了大語言模型 OpenELM，有指令微調和預訓練兩種模型版本，共有 2.7 億、4.5 億、11 億和 30 億 4 種參數，提供生成文本、代碼、翻譯、總結摘要等功能。

雖然最小的參數只有 2.7 億，但蘋果使用了包括 RefinedWeb、去重的 PILE、RedPajama 的子集和 Dolma v1.6 的子集在內的公共資料集，一共約 1.8 萬億 tokens 資料進行了預訓練，這也是其能以小參數表現出超強性能的主要原因之一。

例如，11 億參數的 OpenELM，比 12 億參數的 OLMo 模型的準確率高出 2.36%，而使用的預訓練資料卻只有 OLMo 的一半。

在訓練流程中，蘋果採用了 CoreNet 作為訓練框架，並使用了 Adam 優化演算法進行了 35 萬次迭代訓練。而蘋果的 MobileOne、CVNets、MobileViT、FastVit 等知名研究都是基於 CoreNet 完成的。

蘋果在論文中也表示，與以往只提供模型權重和推理程式碼並在私有資料集上進行預訓練的做法不同，蘋果發布的版本包含了在公開資料集上訓練和評估語言模型的完整框架，包括訓練日誌、多個檢查點和預訓練配置。同時，蘋果也發布將模型轉換為 MLX 庫的程式碼，以便在蘋果設備上進行推理和微調。

「此次全面發布旨在增強和鞏固開放研究社區，為未來的開放研究工作鋪平道路。」蘋果研究團隊表示。

此外，OpenELM 不使用任何全連接層中的可學習偏移參數，採用 RMSNorm 進行預歸一化，並使用旋轉位置嵌入編碼位置資訊。 OpenELM 也透過分組查詢注意力取代多頭注意力，用 SwiGLU FFN 取代了傳統的前饋網絡，並使用了 Flash 注意力來計算縮放點積注意力，能以更少的資源來進行訓練和推理。同，蘋果使用了動態分詞和資料過濾的方法，實現了即時過濾和分詞，從而簡化了實驗流程並提高了靈活性。也使用了與 Meta 的 Llama 相同的分詞器，以確保實驗的一致性。

這次，蘋果很有誠意將程式碼開源，一開到底，把所有內容都貢獻出來了。僅 1 天多的時間，在模型 GitHub 平台上就獲得超過 1100 顆星。

而目前，大模型領域主要分為開源與閉源兩大陣營，國內外知名閉源的代表企業有 OpenAI、Anthropic、Google、Midjourney、百度、出門問問等；開源陣營有 Meta、微軟、Google、商湯、百川智能、零一萬物等。

蘋果身為手機閉源領域的領導者，這次卻罕見地加入開源大模型陣營。有分析認為，這可能在效法 Google 的方式先透過開源拉攏用戶，再用閉源產品去實現商業化營利。

同時，這也顯示蘋果進軍 AI 大模型領域的堅定決心。

作為同為端側模型、開源模型企業，商湯科技聯合創始人、首席科學家王曉剛近期對鈦媒體 App 表示，開源還是對於整個社區的發展還是非常重要的，是一個重要驅動力。最終大模型的發展包括各種應用，還是要整個社區共同去推動的。對於大模型的應用也分為不同的層次，這麼多產業對應用的需求也是不一樣的，豐富的開源社群非常重要。

三立新聞網 setn.com
史上最大支！iPhone16螢幕、鏡頭都變了　4機型一次看
記者谷庭／台北報導很多果粉都在好奇今年iPhone 16會有什麼新變革，目前傳出螢幕尺寸跟鏡頭都會變大，最新預測照片也曝光。社群媒體X上一名用戶Sonny
Reactions7
TVBS新聞網
母親節大降價！iPhone 15現省5千　三星S24限時75折
母親節即將到來，許多人除了忙著報稅，也在煩惱要如何選購母親節禮物，同時還要兼顧節省開支。有鑑於此，各大廠商紛紛推出折扣優惠，像是iPhone 15系列降價新台幣4,000元到5,000元不等，三星S24也現省7,000元，希望藉此吸引消費者購買。
Reactions2
三立新聞網 setn.com
LINE、IG被盜了！2024「最常見網路詐騙」一覽　3C達人示警：要特別記得
生活中心／許智超報導近年來詐騙手法不斷推陳出新，花招百出的騙局令人防不勝防。對此，「3C達人」Tim哥就整理出幾種2024年最常見的網路詐騙手法，包括LINE、IG
三立新聞網 setn.com
母親節折扣超多！iPhone15現省5千！三星S24折7千元
記者谷庭／台北報導正式進入五月，除了報稅，不知道怎麼買母親節禮物又能省荷包，才是最燒腦的事，因此各家廠商也紛紛推折扣，像是iPhone15 系列降價4千～5千不等，
三立新聞網 setn.com
iOS18大升級！傳整合2大內建App　安排行程變超方便
記者谷庭／台北報導蘋果即將在6月開發者大會釋出iOS 18，現在傳出提醒事項、行事曆這兩個App有機會整合在一起，讓用戶使用上更方便。外媒指出，蘋果目前正在
Reactions1
太報
最新行動用戶數出爐　電信三雄市占互有消長！中華電小增台灣大、遠傳略減
NCC本周公布最新行動用戶數統計數字，截至3月底止，三大電信總用戶數為2971.9萬戶，比去年底2985.2萬戶減少13.3萬戶，減幅約0.0045%。最新行動用戶數市佔率依序為中華電信37.7%、台灣大哥大31.7%、遠傳30.5%。
中廣新聞網
蘋果春季發表會倒數　傳首款AI人工智慧平板亮相
蘋果公司（Apple）即將在台灣時間7日晚間10時舉辦春季發表會，主題為Let Loose（不受拘束）設計圖則是手持Apple Pencil，搭配多種顏色的墨水，暗示與iPad產品線有關。根據多家媒體
Reactions1
新頭殼
中國APP資安風險高藏間諜軟體竊取個資
[Newtalk新聞] 中國APP在國際間迅速崛起，不過資安風險引發世界疑慮。民進黨中國部今（3）日表示，TikTok早已被指控會將使用者資料「送中」；Google發現商店中的「拼多多」App內含惡意軟體予以下架；快時尚品牌SHEIN為了收集數據，要求用戶分享App數據和活動，TEMU也利用相同模式，提醒國人盡量避免使用中國APP，以免資安風險升高，個資及手機內訊息等遭閱讀、回傳。中國部說，包含TikTok、SHEIN、「拼多多」等中國APP崛起，然而有跨國網路安全專家指出，中國購物App暗藏間諜軟體，不只竊取個資，更可監控手機內部的其他程式、訊息，甚至更改設定。中國部說，中國短影音APP抖音、TikTok早已被許多媒體報導，會將使用者資料「送中」，TikTok前資深數據師也證實，該公司幾乎每兩周就會將用戶資料傳回中國；「字節跳動」美國分公司前主管更曾在法庭上作證，公司內的黨委官員，有權限查閱用戶的數據，過去就曾利用TikTok的數據，識別與追踪香港示威者。中國部說，去年3月間Google發現商店中的「拼多多」App內含惡意軟體，而予以下架；俄羅斯的資安公司也在APP內部發現惡意
Reactions10
中央社
蘋果5/7春季發表會倒數首款AI平板有望亮相
（中央社記者吳家豪台北4日電）蘋果公司（Apple）將於台灣時間7日晚間10時舉辦線上特別活動，綜合外媒及分析師預測，此次發表會除了推出iPad Pro、iPad Air及Apple Pencil等配件外，最大驚喜是可能首度亮相的M4自研晶片，凸顯蘋果首款人工智慧（AI）平板電腦的運算功能。
中央社
解析P-3C偵蒐數據台美續簽「海上任務支援中心」案
（中央社記者吳書緯台北3日電）國防部今天發布決標公告，駐美軍事代表團已與美方簽署「海上任務支援中心後續技術支援」案，金額為新台幣5億餘元，將履約至2028年底。專家指出，海上任務支援中心是對P-3C反潛機所偵蒐資訊進行解析，並提供技術支援。
青年日報
防信用卡盜刷注意社群騙取個資切勿點擊不明連結簡訊
記者吳典叡／專題報導隨著各類娛樂、觀光與消費增加，信用卡盜刷通報案件數量較去年同期持續增加，尤其，以網路盜刷交易金額增加最明顯；為避免民眾落入陷阱，金管會整
中央社
彰縣推急診應用程式檢傷對接時間快3倍
（中央社記者吳哲豪彰化3日電）彰化縣消防局和彰基醫院合作，推出可傳輸急診病患資訊的應用程式，當病患被送到急診室時，只要用鏡頭掃描條碼，能直接輸入生命徵象、檢傷紀錄等資訊，檢傷對接時間快約3倍。
cosmopolitan柯夢波丹
手機趕快拿出來！5月報稅季超簡單「手機報稅完整教學」、手機報稅QA總整理 | 柯夢波丹
你報稅了嗎？今年報稅真的超方便，拿出手機就能輕鬆完成報稅申報。同時更推出「現金繳納」、「申請延期繳納」與「申請分期繳納」三大功能，想知道如何用手機報稅和手機報稅有那些限制呢？一起來看看。
Reactions1
中央社
學者：中國多元網攻威脅民主台灣須更全面因應
（中央社墨爾本3日綜合外電報導）非營利媒體The Conversation一篇文章提到，中國近年用各種「灰色地帶」策略施壓台灣接受統一，包括網路攻擊，這不僅對台灣的國家安全構成重大威脅，也試圖破壞民主進程。
Reactions3
Cool3c
華為Pura 70系列恐怕並非採用九成的中國零件，新聞主角的日本電子諮詢公司否認曾對Pura 70分析拆解
由於中美貿易戰的影響，華為是受到最大衝擊的中國通訊產業，但同時也激起中國企業一陣大量使用中國自行生產與研發技術的風潮；華為最新旗艦手機Pura 70系列在上市後，中國媒體引述一家日
Reactions1
電腦王阿達
TP-Link 在台推出 Wi-Fi 7 等級 Archer GE800 電競路由器和 Archer BE900 旗艦路由器
隨著人工智慧（AI）的廣泛應用、智能家電的普及以及智慧手機數據傳輸需求的日益增長，公眾對於快速且即時的數據傳輸的渴望不斷上升。這一趨勢也推動了擁有多頻段和低延遲特性的Wi-Fi 7
Mashdigi
Sony即將推出的Xperia 1 VI將搭載焦段達170mm的長焦鏡頭、整合更多人工智慧運算拍攝功能
在市場傳聞Sony準備在5月中旬公布新款旗艦手機Xperia 1 VI之後，目前已經有越來越多消息透露此款新機具體規格，其中包含可變長焦鏡頭最遠焦段將從125mm延展到170mm，廣角鏡頭則將加入微距拍攝功能，而原本以獨立App形式提供使用的Photography Pro，將會與相機App整合，並且整合更多人工智慧運算拍攝功能。
Yahoo Tech
Google Play Store 加入「政府」app 徽章，避免惡意程式模仿
Google Play Store 最新加入了「政府」徽章，只有政府實體可以向 Google 申請並顯示在頁面上，讓市民大眾可以更清楚自己正下載的 app 是否真正來自政府機關。
Reactions1
Cool3c
NVIDIA RTX Remix遊戲重製工具新增支援DLSS 3.5與生成式AI紋理增強
NVIDIA Remix是經典遊戲重製MOD玩家的福音，NVIDIA Remix建立在NVIDIA Omniverse平台，玩家可將經典遊戲導入NVIDIA Omniverse環境
Cool3c
Gemini應用程式與擴充功能正式支援繁體中文，可藉擴充功能串接各式Google應用程式與服務
Google繼將Bard更名為Gimini後，也宣布推出獨立Gemini應用程式，使用戶除了網頁版以外可透過獨立應用程式使用Gemini；Google在2024年5月2日宣布Gem

其他人也在看