圖靈獎得主堅稱「Sora根本不懂物理世界」一文看懂「4大技術步驟」如何做到3D一致性！核心研發團隊全員曝

周育信

2024年2月21日上午5:57

OpenAI影音生成式AI模型「Sora」，甫推出即造成轟動，除了其逼真成品已讓許多科學家和學者基於「Sora是否搞懂了真實物理世界一事」爭論不休，Sora研究的核心團隊也被挖出，其中包含一位00後、年僅21歲！本文將以更白話的方式帶您瞭解Sora運作4步驟，理解它是如何呈現出畫面的「3D一致性」，同時掌握不同專家的觀點，也帶您深入認識這支傑出團隊成員！

Sora是怎麼運作的？

OpenAI指出，有鑑於大型語言模型（LLMs）的成功演進，Sora是一個「擴散型轉換器模型」，得以將各種類型的視覺數據（包含不同型式規格、時間或格式比例的影音或圖像）轉換成統一展現的形式。

步驟１．將視覺數據壓縮且分解為補丁（patches）

Sora首先會在網絡中將影片（一系列圖像所組成）壓縮為低維度的潛在空間表現狀態，而這個生成的潛在空間也能映射回像素空間。

接續這些「表現狀態」會被進一步分解成時空補丁（spacetime patches），而這些補丁即為模型訓練的基礎單元。

步驟２．擴散過程

在此過程中，Sora接收噪聲補丁，會再逐步「預測」原始（隨機初始化）的「乾淨」補丁。

對比來說，就像是ChatGPT生成文字時，也近似一種模型的預測過程。

<cite>OpenAI詳細圖解Sora運作技術步驟。（圖／翻攝自OpenAI官網）</cite> — OpenAI詳細圖解Sora運作技術步驟。（圖／翻攝自OpenAI官網）

步驟３．轉換器

Sora的核心運作採用了轉換器架構（Transformer architecture）概念，此階段主要為處理序列數據，Sora能有效排列補丁、建立關聯性，進而將文字、圖片生成具高度連貫性和細節豐富的影音。

步驟４．生成

最後，Sora可以在適當的網絡大小中，來控制補丁的排列和尺寸，以生成不同分辨率和不同時間長度的影音，就成了60秒的成果影片。

Sora的成品格式和解析度為何？

Sora生成的影片，最佳解析度為1920x1080或1080x1920，時長最長達60秒，同時也可以輸出2048x2048解析度圖像。

輸出大小優於ChatGPT，相對等於內部伺服器和GPU（顯卡，Graphics Processing Unit）也都比ChatGPT更好，流量更大。

此外，除了光影、液體流動、皮膚粗糙紋路得以細緻呈現以外，畫面亦給人「多鏡頭於三維（3D）空間轉換」的真實感與一致性，或呈現特定物體的不同視角型態。

Sora可以幫你做什麼？

⏹︎ 生成逼真且具個人獨特風格的影片

⏹︎ 為你的影片提升豐富度、增加內容和長度，且保持視覺風格一致性

⏹︎ 可將靜態圖片轉換為完整影片

<cite>Sora生成影像即為逼真且具細膩光影變化。（圖／翻攝自OpenAI官網）</cite> — Sora生成影像即為逼真且具細膩光影變化。（圖／翻攝自OpenAI官網）

Sora到底懂不懂物理世界嗎？

▼ 贊同派：

自OpenAI曝光的Sora60秒成品中，外界看到它對於液體流動和光影變化都處理地極為逼真，這讓輝達AI科學家Jim Fan都忍不住讚嘆且斷言：「Sora是一個數據驅動的物理引擎。」

<cite>Jim Fan也稱Sora是可持續學習的模擬器、是「世界模型」認為它會持續學習瞭解物理世界。（圖／翻攝自推特）</cite> — Jim Fan也稱Sora是可持續學習的模擬器、是「世界模型」認為它會持續學習瞭解物理世界。（圖／翻攝自推特）

▼ 反對派：

不過，這番說法讓圖靈獎得主Yann LeCun感到相當不以為然，針對同議題嚴正指出，他認為「Sora理解物理世界」的看法是錯誤的：「讓我在這裡澄清一個極大的誤解，看起來寫實的影片並不表示系統理解物理世界，生成和『從世界模型中對因果關係進行預測』是完全不同的事。」

<cite>Yann LeCun亦分析說道：「一個『編造東西』的工具在創意輔助方面非常棒，但作為幫助你採取行動的心智模型，它完全不適用。」（圖／翻攝自推特）</cite> — Yann LeCun亦分析說道：「一個『編造東西』的工具在創意輔助方面非常棒，但作為幫助你採取行動的心智模型，它完全不適用。」（圖／翻攝自推特）

Keras函式庫的創始人François Chollet也提出質疑說道：「這些系統能夠對特定物理情況可能的演變做出下一幀的視覺預測。因此，它們確實具有物理模型。但真正的問題是，這個模型是否準確？它能否推廣到新穎的實際情況，而不僅僅是在該模型已經訓練過的內定情況上？」

<cite>François Chollet認為Sora並不懂真實世界的物理情況，生成內容也不一定準確。（圖／翻攝自推特）</cite> — François Chollet認為Sora並不懂真實世界的物理情況，生成內容也不一定準確。（圖／翻攝自推特）

科技智能企業家Chomba Bupe也發文直呼，把Sora形容為「數據驅動的物理引擎」的說法相當「愚蠢」，他舉愛因斯坦的例子表示，愛因斯坦花了非常多年的時間才提出重力理論，若如今有人認為Sora的技術和運行過程可以用來和愛因斯坦年輕時在模型訓練期間所獲得的感悟做對比，這是一個值得質疑的事情。

<cite>Chomba Bupe認為，認定Sora理解物理的觀點，是一大錯誤。（圖／翻攝自推特）</cite> — Chomba Bupe認為，認定Sora理解物理的觀點，是一大錯誤。（圖／翻攝自推特）

Sora核心團隊有何來頭？

Sora的團隊成立未滿一年，整個團隊共計有13名成員，其中較特別的是，主要領導人有兩位，分別是Bill Peebles和Tim Brooks，兩人皆相當年輕，為應屆博士！

<cite>（圖／翻攝自OpenAI官網）</cite> — （圖／翻攝自OpenAI官網）

Bill Peebles是於去（2023）年上半年獲取加州大學柏克萊分校博士學位後才成為OpenAI的職員，相當年輕，在輝達和Adobe都有過實習經歷，向來專注研究影像生成、研發模擬技術。

<cite>（圖／翻攝自X／@billpeeb）</cite> — （圖／翻攝自X／@billpeeb）

巧的是，Tim Brooks與他即是師出同門、也同樣在拿到同校博士學位後加入OpenAI，而在研發Sora之前，他已經是DALL·E 3圖片生成模型的主要研究員之一。

<cite>（圖／翻攝自X／@_tim_brooks）</cite> — （圖／翻攝自X／@_tim_brooks）

而除了上述2名主要領導人以外，團隊中另有一位備受矚目的「00後」，名為Will DePue，他出生於2003年、現年21歲，自密西根大學電腦學系畢業後即加入OpenAI。

大學時他曾創立一間顧問公司，這間公司後續還被資訊網路公司「Commsor」看中且收購。

<cite>（圖／翻攝自YT／THE DOCK with Omar Waseem）</cite> — （圖／翻攝自YT／THE DOCK with Omar Waseem）

此外，團隊中還有3位華人，分別是Li Jing、Yufei Guo和Ricky Wang。

Li Jing於2014年自北京大學物理系畢業、2019年獲取美國麻省理工學院物理博士學位，於2022年加入OpenAI；Ricky Wang則是在今年1月才離開Meta、加入OpenAI；至於Yufei Guo則無太多公開背景資訊。

有趣的是，Sora推出後在中國也掀起熱議，曾與Bill Peebles一同發表過論文、畢業於上海交通大學的中國研究學者謝賽寧（Saining Xie）還一度被中國網友誤以為是Sora團隊成員之一。

後續他立即跳出來澄清，說自己並不在Sora團隊裡，不過他透露，Bill Peebles曾說團隊成員基本上不睡覺「高強度」工作了一整年。

Sora問世後有何隱憂？

１．導致加密貨幣詐騙案變多

國外財經資深記者Martin Young示警，若往後Sora使用率變得普及，可能會被加密貨幣詐騙犯濫用，他們可藉由低成本又快速地方式、來製造深偽影片冒充真實人物和公司，推廣詐騙加密專案。

詐騙犯也可使用Sora來製作虛假名人代言web3和加密專案的合成影音，進行詐欺活動，或是大量製作詐騙影片來宣傳加密幣市場操縱計畫。

２．大選期間遭濫用

史丹佛大學研究員Basile Simon則以「令人恐懼」來描述Sora的問世和AI發展速度，它認為看似逼真的虛假生成內容可以如此高速產出，這樣的成品恐怕也會在大選期間被有心人士濫用，讓大眾不知未來還能相信什麼。

３．部分產業被迫改變

法國OTTA數位內容策略公司創始人Stephanie Laporte則表示，她相信Sora會讓影像製作或廣告等產業被迫發生改變，且促使部分公司傾好使用Sora或其他AI工具，來節省人力預算。

更多風傳媒報導

EBC東森新聞·
周五再放一天？12縣市已達停班停課標準
周五再放一天？12縣市已達停班停課標準
Reactions92
三立新聞網 setn.com·
又在信義區！孫安佐竟與混血女星當街打起來　自豪有這項「超能力」
娛樂中心／綜合報導狄鶯與孫鵬的兒子孫安佐在泰國脫序行為之後，2個多月來各種紛爭再度成為話題人物，還曾因在信義區展示有攻擊性的武器被送入警局。台英混血歐斯卡（Oscar）在台北101
Reactions301
民視·
奧運／莊智淵真面目太反差！選手村「新技能+1」網笑：壓力太大
體育中心／許嘉惠報導43歲「桌球教父」莊智淵6度征戰奧運，其中在2012年倫敦奧運奪得第四名佳績，日前他分享打卡選手村及開箱房間的照片，鎮定的表情引發大批網友熱議，而老神在在的他，昨（25日）上傳一段搞笑影片，不僅模仿特殊口音的英文腔，還解鎖「新技能」，逗趣的畫面曝光後，不少粉絲直呼「感覺得出平常壓力很大」。
Reactions9
中天新聞網·
黃捷大翻車！颱風天出國道歉拉「4藍委」墊背　慘被美女立委反擊狠打臉
對於遭黃捷點名凱米颱風來襲時不知人去哪裡，謝衣鳳今錄影回擊，先是感謝黃捷在颱風天想到她，並指出颱風天大家都在選區勘災，即使到現場也都是從旁協助，不希望影響災民重建的工作，狠打了黃捷的臉。
Reactions17
TVBS新聞網·
六都首長颱風成績單來了　好感度第1是他！高雄災情慘陳其邁仍第2
凱米颱風襲台，重創中南部地區，據官方統計，截至25日下午已造成至少6死、超過350傷，尤其高雄市因超大豪雨加上適逢年度大潮，全高市119條區域排水系統與25座滯洪池全滿，多處河川出現溢堤現象。而據台灣議題研究中心（TPOC）最新網路數據分析發現，這次六都首長的「颱風成績單」，網路聲量好感度則是桃園市長張善政（1.27）拿下第一名，其次為高雄市長陳其邁（0.91）。
Reactions163
中天新聞網·
高雄被颱風重創卻找不到黃捷！本人出面回應網友反揪疑點：出國玩不敢說？
凱米颱風直撲台灣，而南台灣的台南、高雄等地更是被暴雨襲擊，多處出現嚴重淹水，然而此時身為高雄立委的黃捷卻不見人影。對此，黃捷本人回應「自己的團隊」從早到晚奔波，對高雄噴政治口水「大可不必」。然而網友卻發現更多疑點，怒嗆質疑黃捷到底人在不在台灣？
Reactions884
TVBS新聞網·
台北風雨小「放颱風假賺爛」？專家揭關鍵打臉：沒這事能這麼和平
颱風凱米直撲台灣，全台多個縣市一連放了2天颱風假，然而今（25）日早有民眾疑惑「北北基桃這樣放颱風假是賺到了？」、「北部風雨那麼小放什麼颱風假？」但氣象專家點出1關鍵，直言若沒發生這件事，「北部還能那麼和平嗎？」
Reactions246
三立新聞網 setn.com·
高虹安有罪「檢察官同天升官」遭狂帶風向　律師揭真相：實在很可恥
政治中心／林昀萱報導新竹市長高虹安被控涉貪助理費46萬餘元，台北地檢署依違反《貪污治罪條例》等罪起訴，一審台北地方法院昨（26）日重判高虹安7年4月、褫奪公權4年。
Reactions248
中天新聞網·
影/高虹安涉貪被判7年4月　新竹街訪民眾「驚人反應」曝光
新竹市長高虹安遭控在立委任內詐領助理費，台北地院昨一審判決7年4月有期徒刑，高主動宣布退出民眾黨並提上訴；對此，中天新聞也隨即進行街訪，有許多民眾認為有罪就要判，但也有民眾認為可能是政治操作。
Reactions134
華視·
行李等2小時還沒到氣炸　華航主管當眾下跪任罵
凱米颱風雖然已經離開台灣，但影響還在！昨(26)日凌晨華航有兩個航班延遲抵達桃園機場，三、四百名乘客在行李轉盤，又等了兩個小時，氣到對地勤人員破口大罵！華航主管緊急出面，安撫乘客的情緒，甚至還當眾下跪...
Reactions180
中央社·
王冠閎分享奧運接駁車慘況須席地坐盼團本部安排
巴黎奧運今天舉行開幕式，接駁車問題仍然無解，台灣游泳好手王冠閎、韓安齊分享，接駁車大誤點、開錯路，加上游泳項目人數多，甚至只能席地而坐，也盼比賽日當天團本部能安排接駁。
Reactions58
三立新聞網 setn.com·
2親人都罹大腸癌！婆婆「剩菜加1物」吃出癌　譚敦慈揭飲食3地雷
生活中心／張家寧報導大腸癌是近幾年台灣癌症的頭號話題，許多名人也都曾因該疾病身亡，對於人體健康的影響程度不容小覷，外界提到大腸癌大多會聯想到攝取加工食品、抽菸嗜酒等壞習慣。
Reactions22
三立新聞網 setn.com·
強颱釀高雄淹水！陳柏惟怒轟酸民「對同胞無情、程度差」：高雄人沒欠你
記者楊士誼／台北報導颱風「凱米」侵台，造成多起災情，25日颱風出海後帶來的西南氣流造成中南部多處淹水，高雄更降下超過2009年莫拉克颱風降雨量的超級大雨，造成多處淹水、滯洪池全滿，
Reactions836
三立新聞網 setn.com·
又有颱風？未來發展曝「下週2天」最接近　專家揭對台影響
生活中心／林昀萱報導凱米前腳才剛遠離，恐又有另一個颱風生成？中央氣象署指出，今（27）日受到低壓帶影響，台灣東半部及南部地區有陣雨或雷雨，並有局部大雨或豪雨發生的機
Reactions39
新頭殼·
凱米前腳剛走又有颱風? 菲律賓附近恐有熱帶低壓生成下週逼近台灣
[Newtalk新聞] 凱米颱風暴風圈今（26）天凌晨脫離台灣本島。中央氣象署最快在今天上午8點半解除海上颱風警報，颱風尾夾帶的豐沛雨量預計會持續到今晚才會趨緩；而凱米前腳才剛走，恐怕又有颱風成形，週末菲律賓東方海面可能會有熱帶低壓生成，預計將朝台灣東南海面前進，下週一到四對台灣會影響。氣象署今天凌晨2點半解除凱米颱風本島警報，凱米颱風今天清晨5點的中心位置在馬祖的西南西方約170公里之處，以每小時16轉12公里速度，向北北西轉西北進行。氣象署預計在上午8點半解除海上警報。中央氣象署預報員陳姵安表示，凱米颱風尾帶來的豐沛雨量預計在今晚就會趨緩。陳姵安提到，週六風向改為東南風，屆時東部、屏東將會出現風場幅合效應，將會有水氣影響。另外，週末在菲律賓東方海面，可能會有熱帶低壓生成，若生成將朝台灣東南側海面前進，下週一到週四對台灣有影響。不過，目前歐洲、美國對熱帶低壓的強度預設仍有分歧，還要持續觀察。此外，氣象粉專「台灣颱風論壇｜天氣特急」25日深夜發布消息指出，目前在菲律賓東南方有一個熱帶擾動（tropical disturbance）95W正在發展，綜合歐美德及幾個AI模式大致都認為
Reactions59
三立新聞網 setn.com·
他喊1縣市完虐北中南：最宜居城市！網戰翻：天然災害真的相對少
鄉民中心／梁雪婷報導台灣各縣市因地理位置、環境設備等，遇到自然災害的損害各有不同。日前，就有網友指出，桃園甚少傳出自然災害的災情，也沒有台北土壤液化的問題，空氣也比
Reactions31
中廣新聞網·
揭發高虹安涉貪　國民黨前議員林耕仁「16字」曝心內話
新竹市長高虹安涉貪案一審判有罪，內政部宣布高虹安停職，高虹安表態將會提出上訴。揭發高虹安涉貪的國民黨前新竹市議員林耕仁今（26）天透過臉書回應：「天道輪迴、舉頭三尺、尊重司法、嚴謹判決」。高虹
Reactions191
TVBS新聞網·
根本不在台灣？黃捷發文嗆「團隊在奔波」網揪疑點：出國玩不敢說
凱米颱風尾橫掃台灣中南部造成嚴重災情，高雄慘淹大水淪為重災區。然而高雄立委黃捷卻被質疑未被到場勘災，國民黨智庫副執行長凌濤更是發文「急尋黃捷」。對此，黃捷今（26）日發文反擊，只是1句「團隊同仁」在地方奔波，再遭網友揪出疑點，質疑她出國玩不敢說？
Reactions325
TVBS新聞網·
高虹安3助理認罪！唯一不認罪「公衛文」　溢領3月慘判刑激動問審判長
新竹市長高虹安因涉嫌浮報助理酬金及加班費，今（25）日遭台北地院依貪污罪判處7年4月，同案被告台大13妹「公衛文」王郁文僅跟高虹安共事7個月，也捲入貪污罪且被判刑，只是獲法院宣告緩刑，稍早老公牽著她離開法院時遭媒體包圍，她表示，對於判決結果心情受到影響，會再跟律師討論。
Reactions828
FTNN新聞網·
躲股災選「它」！交易量暴增達42萬張　股價逆勢漲2.93%　網喊：歐印
[FTNN新聞網]記者蔡昀庭／台北報導因凱米颱風侵襲，台股休市2天，今（26日）開盤補跌，重挫982點，摜破22000點，最低達到21931.9點，收22,119.21點。股民為躲...
Reactions31