為了更好地讓AI畫圖,顯示卡又被炒瘋了

如果說2021年是“元宇宙”的元年,那麼2022年或許就是“AI作畫”的元年。

稍微對網際網路熱點有所關注的人都不難發現,最近,“AI作畫”產出的作品似乎已經成了一股網際網路風潮。這些看起來完成度頗高、畫風又有幾分名家韻味的畫作往往能給人留下深刻印象,而當人們得知這些畫作完全由AI繪製,不存在任何“門檻”,更是又多了一份驚異與好奇心。

在此之前,我們想要收穫一張符合自己審美需求的圖片,要不就在茫茫大海般的同人網站中進行撒網篩選,要不就得花點小錢找中小畫師定製一張。如今,我們可以在平台上輸入各種與風格、主題、氛圍有關的關鍵詞,然後AI就會根據演算法生成符合要求的畫作,藝術似乎在突然之間成為了一件觸手可及的事情。

AI名畫《空間歌劇院(Théâtre D'opéra Spatial)》

當然,上文所說的“門檻”之所以打上引號也是有原因的。因為“AI作畫”的出現,雖然在一定程度上降低了使用者在美術造詣上的門檻,但是卻在其他方面為使用者增加了新的門檻,不論是花大價錢去用別人已經訓練好的AI模型作畫,還是利用顯示卡的本地算力來進行AI作畫,都不是一件簡單的事情。

果不其然,顯示卡廠商們早早洞察到這個趨勢。近日,外媒VideoCardz 消息,輝達已經在最新的522.25驅動中取消了RTX 30系列顯示卡的算力限制,似乎是想用算力全開帶來的AI創作體驗挽回客戶。唯一的問題是,在礦潮褪去、遊戲旺季未至之時,“AI作畫”真的能夠成為刺激顯示卡需求的關鍵嗎?

突然爆火的AI作畫

事實上,“AI作畫”是一個存在了接近半個世紀的概念。根據WikiPedia介紹,早在上世紀70年代,英國畫家哈囉德·科恩便已經開始了AI作畫的嘗試,當時他用自己研發的電腦程序“AARON”去控制一個機械臂進行繪畫創作,而這個演算法也只能產生色彩豔麗的抽象派風格畫作。

(圖源:WikiPedia,哈囉德和他的畫作)

在隨後的五十年時間裡,AI作畫其實一直都是這個趨勢——即可以生成色彩豔麗的抽象派風格畫作,但卻不能生成寫實或者具象的繪畫作品。直到2021年初,OpenAI發佈了廣受關注的DALL-E系統,AI才開始獲得了按照文字輸入提示來進行創作的能力,而AI作畫的發展更是進入了突飛猛進的階段。

在隨後的一年時間裡,隨著Disco Diffusion、DALL-E 2、Imagen、Midjourney和Stable Diffusion等作畫工具先後出現,AI作畫的風格開始變得越來越多變,生成的圖片不再侷限於抽象,而是能夠產出具體的人物/事件,畫出的作品也越來越符合邏輯。

然而,要說“AI作畫”這個概念真正火起來,那還得是2022年的下半年。因為在這段時間裡,出現了兩個專攻二次元作畫的網站,其中一個是8月底上線的AI作畫網站mimic,該網站主攻日系二次元畫風頭像,要求使用者上傳15至100張圖像讓AI進行學習,然後輸出相同畫風的AI畫作。

所謂mimic,就是模仿者、擬態物的意思,這個命名非常好地展現出該網站的核心賣點及爭議要點。模仿原作者畫風生成的AI畫作,雖然很接近使用者喜好的作畫風格,但明顯會給原作者帶來困擾,隨後畫師們掀起的一系列“拒絕畫作被mimic使用”的浪潮,更是讓這個網站的經營者做出了緊急下線的決定。

(圖源:mimic)

儘管mimic涼了,但是利用二次元AI作畫來盈利的網站顯然不會只有這麼一個。10月上旬,一家名為NovelAI的網站悄然上線了AI作畫功能,該網站採用了開元的Stable Diffusion作為基礎,搭配上採集自P站熱門作品的NovelAI Diffusion模型,可以讓使用者輕鬆創作出完成度頗高的二次元畫作。

和過往的AI作畫不同,NovelAI的入門方式簡單(註冊會員)、創作方式多樣(文字生成、原畫改寫、簡筆畫生成)、出圖素質較高(有充分訓練的多個模型打底),最重要的是,符合二次元愛好者的取向,這也使得“AI作畫”這個概念在本月迅速爆火。至於NovelAI非法爬蟲P站稿件訓練模型,或是網友利用草稿生成畫作反訴作者這些爭議事件,則都是後話了。

與日俱增的顯示卡需求

那麼有人就會問了,既然這些“AI作畫”都是跑在伺服器上的,那又怎麼會對顯示卡市場的供需關係帶來影響呢?

答案非常簡單,那是因為目前市面上存在著兩種AI繪畫的方法。其一是線上法,使用者只要花錢就能在NovelAI上面無限生成畫作,這樣的優點是沒有顯示卡算力的限制;其二是本地法,通過在本地載入AI演算法和模型來生成畫作,這種做法的優點是生成作品沒有限制,而且不用花錢,但是所有運算過程都得靠自己的電腦來跑。

(圖源:知乎)

為了測試本地AI作畫對性能的要求,小雷昨晚特地用一晚上時間完成了本地版NovelAI的部署。經過實測,在載入洩露壓縮版模型(4GB)的情況下,移動版RTX 3060顯示卡最多隻能生成360*512尺寸的圖片,而且生成一張圖片的時間長達5-10分鐘,體驗非常拖沓。

值得關注的是,本地版NovelAI已經是目前佔用資源最少的一種架設方式了,StableDiffusionWebUI的佔用更高,而且這載入的還是壓縮版模型,因為記憶體限制的緣故,移動版RTX 3060顯示卡無法成功載入目前洩露出來的完整版模型(7GB),在作畫質量上會有些許差距。

(圖源:twitter,採用IMG2IMG演算法做出來的圖,理論顯示卡運存不低於16GB)

總的來看,擁有6G運存的獨立顯示卡算是目前運行本地版AI作畫的一個基礎組態,而且越新的顯示卡體驗就越好。目前RTX計算卡是運行效果最理想的顯示卡,其次則是30系顯示卡,20系、10系及以下老顯示卡的支援都不太好,至於AMD顯示卡則是完全沒有進行過最佳化。

對於可以妥協的使用者來說,個人建議通過採用低解析度生成畫作,然後Upscale至高解析度的方式來生成畫作。這種做法可以有效降低顯示卡佔用,讓只有基礎組態的使用者也能借此進行畫風/人物學習,但是這樣生成的圖片在整體畫面細節上肯定會有所缺失。

至於追求畫作質量的使用者,那自然就要更換顯示卡了。正好,9月23日,輝達在GTC大會上發佈了新品顯示卡RTX40系列,其中RTX 4090採用台積電“4N”製程工藝和高達24GB GDDR6X視訊記憶體,相比上一代RTX3090Ti性能提升可達2~4倍,可謂是完美的AI作畫工具。

不得不說,這波浪潮的到來,和RTX 40系顯示卡的發佈時間可謂完美契合,再加上老黃近日及時解鎖的RTX 30系算力限制,難怪NGA論壇的使用者都在討論:“怎麼感覺礦潮之後,AI作畫要成為新的顯示卡需求啊?難道這波作畫模型洩露的受益者,真的是剛剛發佈新顯示卡的老黃?”

對於這個觀點,個人覺得應該分開來看。對創作者而言,在虛擬貨幣的風波過去後,顯示卡在AI算力方面的提升才真正被釋放了出來。AI作圖工具在二次元的產業應用上肯定是非常強的一個存在,畫師可以用其輔助作畫、輕小說家可以用其繪製人設,至於獨立的遊戲製作人更是可以大幅降低成本。

但是對普通人而言,AI作圖工具本質上只是風靡一時的新玩具罷了。儘管不用親手繪製,但是想從AI繪製出來的大量作品中找出高品質作品也是一件非常需要耐心的活。在這一波熱潮過後,大部分人還是會回到收集畫師作品的軌道上,想要借此拉動大量顯示卡需求確實有些不太現實。

在顯示卡需求下滑的當下,強如輝達也需盡快尋找顯示卡之外的新業務,為下一階段業績增長提供更多想像空間。有趣的是,從Nvidia Canvas的推出來看,輝達確實有考慮過發展“AI作畫”這方面的業務。AI作畫或許不能成為刺激顯示卡業務增長的動力,但是其能否成為輝達未來所倚重的優勢業務,還有待進一步觀察。

本文來自微信公眾號“雷評雷測”(ID:leireviews),作者:三明治,36氪經授權發佈。原標題:《為了更好地讓AI畫“澀圖”,顯示卡又被炒瘋了》。

本文經授權發布,不代表36氪立場。

如若轉載請註明出處。來源出處:36氪