Meta二代「SAM 2」來了！AI一鍵分割影片中物件，還免費讓外界開源，祖克柏有何野心？

數位時代

2024年7月31日上午12:02

去年Meta推出能夠分割圖像的Segment Anything模型大受外界好評，相隔一年後的現在，Meta帶來了第二代Segment Anything模型（後稱SAM 2），加入了辨識影像中各個物體的技術，並且免費開放所有人使用。

Meta提到的「分割」指的是，AI模型辨別圖像中的各個要素，並將其獨立出來，好比說一段運球的影片中，AI能夠知道籃球是籃球，球員是球員，籃球並不是球員身體的一部分，並將各個物體分割出來。這項技術能夠用於科學研究或編輯照片，依照Meta透露的資訊，目前SAM已應用在分析珊瑚礁、救災圖像、檢測癌症等眾多面向上。

用最大資料集煉成，靠「單幀」分割影片物體

而現在最新發表的SAM 2，主要更新是將這些功能拓展到了影像裡。Meta強調，影像中分割遠比圖像困難，因為物體的位置會隨時間快速變化、過程中可能被遮擋或形狀改變，這都加劇了分割的難度。

不過Meta在部落格中提到，一張圖像可以被視為僅具有單幀（frame）的極短影片，他們便是從這個角度切入來開發新模型。在影片中分割的唯一差別在於，模型需要依靠記憶體回憶起該影片之前處理過的資訊，好在當下時間準備分割物體。

且要實現影像中分割自然需要經過大量訓練，在發表SAM 2的同時，Meta也開放了有著超
過5萬部影片的標注資料集SA-V，並包含超過60萬個時空遮罩（Masklet）。時空遮罩會標注物體的時間及位置，是現有最大影像分割資料集的53倍大。

且根據《TechCrunch》報導，Meta還在論文中提到訓練材料包括一個著10萬部影片的內部資料集並推測可能來自Instagram和Facebook上的公開資料。

近日廣受矚目的祖克柏與輝達執行長黃仁勳在SIGGRAPH 2024活動上對談，就提到了新推出的SAM 2。「科學家利用這項技術來研究珊瑚礁、自然棲息地之類的東西，不過能將這項技術應用到影片，並且在沒有樣本提示的情況下告訴它你想要的，這真的非常酷。」祖克柏表示。

《TechCrunch》指出，雖然處理影片需要更龐大的運算能力，使得SAM 2有更高的硬體要求，但在Meta推出這系列模型前，想要如此迅速、靈活的分割影像中的物體根本不可能辦得到。

不過Meta表示，SAM 2仍有一些缺憾，在較為複雜的場景中很難持續鎖定要分割的物體，例如多隻馬一齊狂奔的影片中，SAM 2會在中途失去鎖定，需要人為手動校正；又或者同時分割多個物體時效率會大大降低，未來還有改進的空間。

SAM 2仍免費開源使用，祖克柏目的打造更完備模型

不過如此具有突破的模型，Meta仍然免費開放所有人使用，在Apache 2.0授權條款下發布這款新模型。

Meta強調，他們鼓勵AI社群嘗試使用這次的新模型、使用他們的資料集並希望透過分享這個研究，為圖像分割及相關領域的發展做出貢獻，並期待這次分享能激發社群產生新的見解、帶來有幫助的經驗。

Meta近年在AI領域的發展，一直堅定擁護開源開放的路線。祖克柏也提到，雖然Meta的開放並不是全然是出於做功德的心態，但不代表他們別有居心，「你需要圍繞它的生態系統，如果我們不開源這些功能就不會這麼好用，沒錯吧？我們選擇開源並不是因為我們大公無私，而是認為這麼做可以讓我們打造的東西變得最棒。」

就在發表SAM 2的前一週，祖克柏撰寫了一封公開信，透露他們正努力使開源成為AI領域的產業標準，強調這項技術比其他任何技術都有潛力提昇人類的生產力、創造力及生活品質，為社會及科學的革新帶來貢獻。Meta聲稱去年推出SAM後在AI社群帶來的迴響令他們印象深刻，預計SAM 2將帶來更為令人興奮的可能性。

延伸閱讀：首批iPhone 16恐不含AI功能！蘋果擬推遲Apple Intelligence上線，問題出在哪？
詐騙靠Deepfake語音假扮CEO！法拉利高管險遭設局，他如何靠「1句反問」化解危機？

資料來源：TechCrunch、Meta（1）、Meta（2）

責任編輯：蘇柔瑋

三立新聞網 setn.com·
iPhone充電到幾%最好？　專家：開啟這功能　電池續航力UP
坊間傳言，手機和筆電充飽電仍持續插著電源持續充電，恐會導致鋰電池衰退，不過新的3C產品，其實都有自動調節充電功能，蘋果iPhone 15後繼機種還能設定最高80%的手機「充電上限」，不過充電要充到多少%，才能兼顧日常使用和避免鋰電池衰退呢？
TVBS新聞網·
半價版YouTube Premium回來了？1族群最愛　新版功能曝
Google旗下影片平台YouTube，去年曾推出訂閱服務「YouTube Premium Lite」，主打零廣告卻遭砍掉。不過，近日有消息指出，這項服務可能有望復活，只不過「廣告不會完全去除」，目前正在3個國家進行測試。
Reactions9
FTNN新聞網·
iPhone 17 Pro將迎更小動態島？　外媒曝記憶體、鏡頭畫素再升級
[FTNN新聞網]記者曾奕語／綜合報導蘋果iPhone16系列上市滿月，但外界早已將目光轉向iPhone17系列，分析師JeffPu新爆料指出，iPhone17Pro系列鏡頭畫素都將升級...
Reactions3
鏡新聞·
真假難辨！中國「美女機器人」發傳單　竟是真人假扮｜#鏡新聞
機器人技術不斷進步，仿生機器人，現在跟真人真假難辨。中國重慶街頭，最近出現一位美女機器人，在路上發傳單，由於外貌實在太像真人，吸引大批路人圍觀，其實，就是一位火鍋店老闆娘假扮！因為擅長跳機械舞，這位老闆娘在店裡，就經常扮成機器人來服務客人，掀起不少話題。加入頻道會員支持鏡新聞🩷： https://www.youtube.com/channel/UC4LjkybVKXCDlneVXlKAbmw/join
三立新聞網 setn.com·
iPhone充電到幾%最好？新功能充電上限　曝五種調整技巧
許多人都認為，手機與筆電100%電仍繼續充電，恐導致離電池衰退，不過新的3c產品都有，其實都有自動調節充電功能，iPhone 15後的機種可設定最高80%的「充電上限」，減少鋰電池的衰退風險。
TVBS新聞網·
iPhone怎充電最優？專家曝「黃金%數」：電池續航力大增
iPhone的「電池健康度」向來是果粉們評估是否該換手機的重要標準。而在Apple推出iOS 18後，用戶甚至可以為了兼顧延長電池壽命與個人需求，自行調整充電上限至80%、90%、95%、100%。不過，究竟該選哪個電量才能最有效保護電池？也成了各界探討的議題之一。
中時新聞網·
iPhone充電到幾％最好？專家曝重要功能：延長電池壽命
不少人認為手機充電至100％，繼續充電會導致鋰電池衰退，但日本3C網站「OTONA LIFE」表示，iPhone可開啟調整充電上限，調整到100％就能啟用「電池充電最佳化」，會緩慢充電到100％，能減少長時間處於充電100％的狀態，根據蘋果官網顯示，此功能僅限於iPhone 15及後續機型，而iPhone 14和之前機型可開啟設定中的「最佳化電池充電」，來延長電池壽命。
TVBS新聞網·
iPhone 17 Pro正面亮點曝光！　被爆動態島將首次縮小
蘋果iPhone 16系列上市才一個月，外界已經開始揣測起iPhone 17的設計，知名分析師 Jeff Pu也在網上分享他的預測。
Reactions1
三立新聞網 setn.com·
玩家先衝！Apple Intelligence測試版寫作工具釋出　還可通話錄音、轉錄
「蘋果」公司釋出「iOS 18.1」與「iPadOS 18.1」第七版測試版本，持續測試「Apple Intelligence」人工智慧功能。該功能目前僅支援「iPhone 15 Pro」及「iPhone 16」系列機型。此次更新除了加入通話錄音與轉錄功能外，「iPhone 15 Pro」系列機型也新增空間拍攝選項。
Mashdigi·
Google將Gemini人工智慧技術用於新版Google Shopping服務，協助使用者更容易找到所需商品
Google很早以前就開始將人工智慧應用在其線上購物服務，其中包含讓使用者透過Google Lens功能搜尋類似或相同商品，以及藉由人工智慧方式讓使用者能在線上「試穿」衣服。而Google稍早更將Gemini技術進一步用在Google Shopping服務，讓系統能協助使用者透過網路找到最符合個人所需的商品。
Yahoo Tech·
Samsung 釋出了「Galaxy Fold 6 特別版」的預告影片，定檔 10 月 21 日公布
Samsung 昨日在官方新聞 YouTube 頻道中釋出了 11 秒時長、標題為「【邀請函】10 月 21 日，全新Galaxy亮相」的影片，
電腦王阿達·
Windows 如何檢查 SSD 健康度？4 種方法
雖然電腦的 SSD 不太可能突然掛掉，多少在快壞之前，就會有一些狀況出現，如：常常突然藍白畫面，但如果平常能定時檢查 SSD 健康度，那發生問題之前，就能做好預防，像是趕緊買新的
Mashdigi·
報導指稱蘋果將在iOS錢包App增加支援Volvo、Polestar及奧迪車款使用的數位車鑰匙功能
報導指稱，蘋果接下來將在iOS作業系統的錢包App加入支援Volvo、Polestar及奧迪車款使用的數位車鑰匙功能，讓使用者能直接以iPhone、Apple Watch即可解鎖車門，並且啟動車輛。
Yahoo Tech·
Sony 推出支援 USB PD 快充功能的 BC-ZD1 充電器與 DC-C1 直流電轉接器
Sony 推出了兩款針對 Alpha 系列相機，支援 USB PD 快充功能的電源產品：BC-ZD1 充電器與 DC-C1 直流電轉接器。
三立新聞網 setn.com·
Android 15增防搶功能外媒實測遠端無法鎖定「還有2缺陷」
Google在「Android 15」作業系統加入全新的防盜功能「Theft Detection Lock」，然而該功能在使用上存在不少問題。Android測試者Nick Fernandez表示，該功能主要透過手機加速度計偵測突然移動或方向改變，確定設備遭竊時才會啟動功能，而後讓手機進入鎖定畫面，防止竊賊進入擁有者的應用程式。
三立新聞網 setn.com·
電信拚萬能生態圈！遠傳幣破27億規模　訂機票回饋12%、演唱會5折
「遠傳電信」旗下「心生活App」憑藉創新支付與數位服務，吸引超過600萬用戶加入，其中非遠傳用戶占三成！遠傳幣推出「放大折抵」優惠，1遠傳幣可折抵2元，在四大超商的咖啡寄杯服務更提供1遠傳幣抵5元，加上「friDay聯名卡」消費最高8%點數回饋，使點數經濟規模突破27億，締造數位消費新模式。
中央社·
Google遭令開放app下載與付費方式法官同意暫緩執行
（中央社舊金山18日綜合外電報導）美國加州1名聯邦法官今天同意Google（谷歌）請求，暫緩執行他本月初下令Google在11月1日前改革Android作業系統的應用程式商店Play，好讓消費者下載軟體方式有更多選擇。
CTWANT·
打詐APP不好用　數發部長認了：還有進步空間
[周刊王CTWANT] 張嘉郡昨日質詢行政院長卓榮泰、黃彥男時指出，去年詐欺案件共3萬7823件，較前年增加8314件，多了28.17％，打詐愈打愈多，數發部耗費1300萬元推出打詐APP，上架沒多久就「公測完成階段性任務」下架。張嘉郡指出，打詐APP在手機Apple store跟Play商店的評價最低只有2.6顆星，...
Reactions3
三立新聞網 setn.com·
張清芳驚吐找不到張菲了！私下聯繫費玉清　得知近況留遺憾
去年張清芳在台北小巨蛋開唱時，二姐江蕙也有到場欣賞，甚至還為了張清芳破例拿起麥克風，在萬人面前再次歌唱，也因為這樣，掀起了後續一連串的蝴蝶效應，讓江蕙決定重返歌壇，重拾封印九年的麥克風，站上大巨蛋舞台，而張清芳睽違一年再次在小巨蛋開唱，其中橋段還播放了過去在張菲和費玉清的綜藝節目，精彩的花絮片段，也透露了近期和費玉清聯絡的狀況。
Reactions48
CTWANT·
金鐘59／金曲歌王登台飆唱！疑走音遭酸車禍現場　網譏「唱KTV」兩派戰翻
[周刊王CTWANT] 據了解，HUSH擔任本屆金鐘獎表演嘉賓，今天和台北愛樂少年樂團一起登台演出，先是帶來個人曲〈第三人稱〉，接著獻唱公視影集《天橋上的魔術師》的主題曲〈小心翻閱〉以及台劇《我們與惡的距離》的主題曲〈別讓我走遠〉，讓現場氣氛迎來一波小高潮。不過，HUSH表演畫面播出後...
Reactions69

用最大資料集煉成，靠「單幀」分割影片物體

SAM 2仍免費開源使用，祖克柏目的打造更完備模型

其他人也在看