善用Sora 人人都可成為專業導演

最近OpenAI又推出了一項新科技,使用者給出一段文字描述就能由旗下最新的AI影片產生器Sora直接生成一段60秒的逼真影片,震撼全球。

9段Sora影片,包括走在熱鬧東京街頭的時尚女性、淘金時代的場景鳥瞰、踏著皚皚白雪奔跑的猛獁象……。每段影片,看來都非常專業,運用鏡頭推移轉換,準確地表達角色情感與和視覺風格。外媒《Wired》聲稱,這是沒有在其他影片生成AI模型中看見過的真實感,並且生成的影片長於其他模型。

根據OpenAI在官網上的介紹,Sora能夠生成包含多名角色、特定動作類型以及大量細節的複雜場景,而且AI不僅了解用戶在提示詞所說的各種物體,還知道這些物體是如何存在於現實世界,進而營造出讓人驚豔的逼真感受。

看起來AI逐漸可以摸透人類的想法,然而這還是大量計算的結果,不是像人類直覺的反應。不過令人擔心的是,AI已經侵入人類的藝術工作層面。一般我們說科學的研究是邏輯推理,這種思考是「垂直思考」。電腦運算的速度很快,勝過人類,這可以讓人類輸得心服口服。但是這種藝術類的範疇,屬於「水平思考」,不是直線邏輯的推理而是天外飛來一筆的想像。美學的東西,現在電腦竟然可以做得這麼好,令人驚嘆。

然而仔細思量,藝術作品人類還是可以進行邏輯的解析,將其脈絡化,所以當電腦把訣竅寫入程式,也可依樣畫葫蘆做出類似作品,或甚至是創造出新鮮的東西。最近網路流傳一個故事,書法家孫大川寫了個對聯,右聯「酒二共識」,左聯「一盅各表」,廣求橫批,一直沒人對得很好。沒想到上網詢問,ChatGPT居然對出了神橫批:「合瓶共醇」,就像是神來之筆。

然而,這樣的發展,令人擔心的事就誠如我最近看到的一個段子,AI是不是發展錯方向?AI怎麼不是要幫我省卻工作上的辛苦:倒垃圾、照顧小孩,反而是來搶走我的工作?

去年好萊塢的罷工,先是編劇抵制ChatGPT:抗議AI侵犯創作權益,後來又有編輯拒絕為ChatGPT產生的劇本草稿修改潤飾,因為他們感覺這是為AI打工,雖傷害性不大,但侮辱性極強。在日本,AI繪圖工具MIMIC也遭到繪師的集體抗議,因為只要使用者上傳同一名繪師30幅以上的原創作品,給AI進行訓練後,接著MIMIC就能自動產出與該繪師藝術風格相似的圖片。

回過來說,目前Sora影片還是有些缺點,例如角色可能走過雪地卻沒有腳印;可能咬了一口餅乾,餅乾卻沒有咬痕。目前Sora對於光影的移動掌握還不夠精準,也還做不到準確描述一些物理作用的細節,比如人類手部的精巧動作,但相信未來一定可以改進解決的。

我們該要如何面對這樣的衝擊?由於晶片、程式、算力還在突飛猛進的發展,AI再來應是等比級數的進化。工作及智財權的保障問題固然要解決,如何懂得駕馭新進的AI,善用它們來為人類工作,恐怕才是職場勝利者最該做的事。

像「老高與小茉」這些YT (YouTuber)應該也很興奮,因為從此不用在素材庫裡找不太合適的影片,全部可自主貼近主題的生成。對於一般人,玩玩票,自己編個劇,就可以當導演,生成段影片,搞不好還可以找到自己被埋沒的天賦。至於我,就等著Sora正式公布後,下個指令描述來生成影片,加入我的簡報,讓我的演講更加生動。(作者為中信金控首席經濟學家、中信金融管理學院講座教授)