OpenAI揭祕》再推自動生3D,誰得利?

繼聊天機器人ChatGPT,OpenAI上週又宣稱,已研發出數分鐘就生成3D模型的Point-E,速度超車Google類似應用600倍!到底那是什麼、厲害在哪裡?又為何有人認為這股AI開發潮,得利的另有他人?《遠見》一文完整解析。

由馬斯克擔任創辦人之一的OpenAI團隊,今年連續推出文字轉圖像DALL-E;聊天機器人ChatGPT兩款AI工具,都大受歡迎後,接下來的動向已被全球業界盯上。12月中,這個眾所矚目的團隊竟又有新創舉!

打幾個字指揮電腦,就能生出3D模型

12月16日,OpenAI中的Alex Nichol 、Heewoo Jun、Prafulla Dhariwal、Pamela Mishkin,Mark Chen 5人團隊,共同釋出了一篇名為《Point- E︰一個從複雜提示生成3D雲的系統》文件。原來是宣稱他們開發出的Point- E工具,已可以讓AI只要根據人們所下的文字指令,就能在短短幾分鐘內生成3D點雲模型。

那到底是什麼?簡單來說,你若想要一只3D版本的耳機圖,現在不必找人類精心設計,只要鍵入「耳機」這個文字指令,Point- E的AI就會在幾分鐘內幫你模擬繪出一只耳機的3D點雲模型,比起OpenAI之前推出的DALL-E,下文字指令就幫你生成圖片,功能上又更強。至於同業的Midjounrney,也還不能用3D繪圖呢。

只要鍵入「耳機」這個文字指令,Point- E的AI就會在幾分鐘內幫你模擬繪出一只耳機的3D點雲模型。取自Point- E
只要鍵入「耳機」這個文字指令,Point- E的AI就會在幾分鐘內幫你模擬繪出一只耳機的3D點雲模型。取自Point- E


雖然Point- E目前生成的模型看來都有點粗糙,在3D界卻是超前創新。據該團隊指出,雖然業界早已有其他類似的3D生成應用推出,大多需要花費好幾個小時,或操作多個繪圖晶片(GPU)才有辦法繪出一張圖。

由OpenAI帶來的改善是,Point-E只需要用上一個GPU,在短短1到2分鐘內就能生成一個3D點雲模型,無論是成本或效率都大大提高。

OpenAI開發3D生成,超車Google同類應用600倍

消息一出,馬上引來NVIDIA旗下人工智慧科學家吉姆.方(Jim Fan)的大力推崇。他本週二(20日)在個人Twitter上發推指出,Point-E比起Google開發的3D生成應用Dream Diffusion可是快上了600倍!文轉圖的DALL-E已讓全球業界天翻地覆,他無法想像這款應用會如何顛覆全世界?也許會在遊戲,元宇宙或VR方面帶來革命。

這位科學家並樂觀預測,2023年將會是3D模擬的元年,各類相關應用將如雨後春筍般萌生。

其實,不僅Google,這位科學家出身的NVIDIA,也推出過文字生成3D的AI應用。在今年11月,該繪圖晶片團隊,提交了一份論文,指出他們開發的Magic 3D,只要下達一段文字指令,例如「坐在睡蓮上的藍色箭毒蛙」,AI就會忠實按照所有細節,繪出這樣的青蛙3D模型。

而這個應用約需花上40分鐘畫出一款3D模型,當時NVIDIA欣喜地宣稱,比起Google的Dream Diffusion要花上1.5個小時,效率上已快了兩倍。並指出只要稍微修改,就能用來為遊戲或CGI素材,可大量精省人力。結果才過一個月,就被OpenAI團隊給狠狠追過。

NVIDIA也有類似應用被超越,團隊卻大力稱讚敵手

不少專家指出,其實,NVIDIA與Google開發出的3D生成應用,成品的畫質細緻度,都比OpenAI明顯精緻,只是後者速度上大勝,在重視效率的科技業來說,常常快就是贏。

但更引人好奇的是,出身NVIDIA的科學家大力稱讚同業敵手,完全不嫉妒,透露出什麼線索?一些科技界人士私底下笑說,大家恐怕都掉進了繪圖晶片廠商的陽謀。

NVIDIA在疫情期間,曾因著供應鏈短缺,以及疫情下的宅在家遊戲潮與以太幣挖礦潮讓包含繪圖晶片(GPU)的顯示卡賣翻,價格也跟著長期缺貨水漲船高。然而2022年以來,供應鏈瓶頸不再,歐美各國都迎向解封,加密貨幣則遇上熊市,這些狀況讓需求銳減,顯卡價格開始雪崩。身為GPU龍頭業者的NVIDIA自然不好過。

更糟的是,美國啟動晶片戰爭,還限制NVIDIA這類晶片設計業者,不得銷售AI晶片到中國,這些狀況讓NVIDIA的股價今年跌個沒完。

然而,崛起中的AI繪圖應用,相當仰賴NVIDIA這類廠商設計出的GPU提供運算能量。例如,另一當紅的AI繪圖應用Midjourney,創辦人候茲(David Holz)就曾在近期受訪感嘆說,他和團隊開發出的這款應用,可能是市面上推給消費者的應用中,最吃運算能量的一種。由於得仰賴相當高階又昂貴的GPU伺服器來運作,公司燒錢與燒資源不在話下。

但候茲樂觀期待,當AI這波應用夯起來,相信不久後,就會有人開發出新型遊戲機,裡面搭載最強AI晶片,屆時再神奇的遊戲內容都不再是夢想。

NVIDIA也有AI應用,圖為NVIDIA製作釋出執行長黃仁勳的虛擬分身 Toy Jensen。截自YouTube
NVIDIA也有AI應用,圖為NVIDIA製作釋出執行長黃仁勳的虛擬分身 Toy Jensen。截自YouTube

GPU雪崩與PC高庫存有解

專業電腦媒體《PC World》資深編輯哈曼(Mark Hachman)則曾警告,若玩家常在筆電上做這類AI畫作,一般筆電硬體規格絕對不敷所需,被操垮機率很高,他建議改用電競筆電,並配備NVIDIA繪圖晶片與許多Video RAM(影像隨機接達記憶器)。另一間廠商AMD則是規畫在未來跟進類似規格的繪圖晶片。

從此觀之,如果AI科學家吉姆.方預言的「2023是3D模擬元年」,那麼顯示卡的價格雪崩潮、PC的高庫存危機,都可以在這波AI繪圖熱潮中,找到紓解反轉生機。難怪,即便這類AI工具仍存在不少隱憂與爭議,努力求存的科技廠商仍要積極喊多,以便喊出新市場。

2023人人在家玩AI

至於一般人如何因應?如果你是懂程式的人士,與其擔心被淘汰,不如看看OpenAI團隊已大方地已開源Point-E,放在Github上,希望藉此鼓勵更多人參與做這類創新。不懂程式的人,至少學著理解這類應用,試著融入工作中或提出批判也行。2023年人人在家玩AI創新,可能是大未來。

更多精采報導,歡迎加入《遠見》 Line官方帳號

加入遠見雜誌LINE好友,接收更多好文章!

看更多遠見雜誌文章:
ChatGPT支援中文嗎?如何用得更順手?
ChatGPT帶來什麼改變與威脅?馬斯克:AGI將使人類獲超智慧或文明滅絕
AI不輸真人!NVIDIA老闆分身獻唱聖誕歌