全由AI生成的電影!畫面不自然、角色表情詭異,但「最大問題」克服了⋯

過往人們認為AI在影視產業的應用可能是協助撰寫劇本、協助動畫電影作圖等等,但未來有可能一切都要改觀了。《冰霜》(The Frost)是一部完全由DALL-E 2創作的12分鐘電影。這部電影由位於底特律的影片創作公司Waymark製作,雖然展示了AI電影製作的潛力,但詭譎的敘事風格和令人不安的能力也同時展現了出來。

AI電影如何產出的?公司又是什麼來頭?

《MIT Technology Review》報導,為了製作這部電影,Waymark採用了該公司的執行製片人兼導演魯賓(Josh Rubin)撰寫的劇本,並將其輸入到OpenAI的圖像生成模型DALL-E 2中。經過一些嘗試和調整後,以便讓模型產生符合他們滿意的風格的圖像。製片人使用DALL-E 2生成了每一個鏡頭,接著他們使用了一種名為D-ID的AI工具,可以對靜止圖像加入動態,像是眨眼或是讓嘴唇移動等等。

Waymark是一間廣告起家的公司,將數種不同人工智慧技術結合在一起,提供客製化廣告影片。它們使用了包括大型語言模型、圖像識別技術以及語音合成,旨在即時的生成一段廣告影片。製片人魯賓表示,「我們用DALL-E產出的東西建構了一個世界,雖然目前呈現出看似奇怪的美學,但我們仍然張開雙臂歡迎它」。

獨立電影製作人梅達維(Souki Mehdaoui)表示,「這無疑是我看過的第一部風格一致的生成性人工智慧電影,生成靜態的圖像並用類似魁儡戲的敘事風格,帶來一種有趣的拼貼感。」言下之意即過往AI產製的電影經常會有風格不一致的問題,但這部作品克服了這點。

AI技驚四座,依然有明顯破綻的奇特美學

《MIT Technology Review》指出,這部電影加入了一系列使用生成式AI工具製作的短片,而這些片段在過去幾個月中已經推出過。目前市面上最好的生成式AI模型只能生成幾秒的影片,這部以許多靜止圖像和長度不等的影片結合而成的電影雖然看似有許多破綻,但已經是目前所能呈現的最好畫面。

從這部電影中可以看出許多明顯的不自然處:

  • 男性角色吃東西時不自然的臉部表情

 圖/YT截圖
圖/YT截圖
  • 靜態畫面中人物與背景的違和感

 圖/YT截圖
圖/YT截圖
  • 人物跌下山峰的不自然畫面

 圖/YT截圖
圖/YT截圖
  • 角色手指的明顯破綻

 圖/YT截圖
圖/YT截圖

從影片中可以看到,雖然畫面中的人物大多是靜態的,但因為是在冰河氣候中,人物還是有口吐霧氣的動態感,而在沒有人物或動物的畫面中,畫面也較為自然,可以說人物的細微面部表情是目前的技術限制之一。

生成式AI可能越來越多人採用,業內人士怎麼看?

廣告公司Private Island的客戶囊括百威、Nike、優步(Uber)等跨國企業,而它們這幾年來也一直在製作短影片的後期導入AI工具,例如使用機器學習技術從現有影片中提取動作捕捉數據,而不是土法煉鋼地從頭開始收集。

這家公司在幾個月前發布了一則名為合成之夏(Synthetic Summer)的惡搞啤酒廣告,該廣告使用Runway公司的影片製作模型Gen-2和Stability AI的圖像製作模型Stable Diffusion製作。

聯合創辦人波以耳(Chris Boyle)表示生成式AI這項技術是新的境界,更提到「這將改變一切」。

但也有許多公司在意成本方面的考量,雖然生成式AI的技術讓人驚艷,但科技的推出日新月異,許多人擔憂科技變化的太快,不願將資源投入。波以耳提到也有許多人擔心如果使用有版權的影像而遭到法律訴訟的問題。

延伸閱讀:【專欄】ChatGPT能寫劇本、拍電影!它究竟是得力助手還是暗黑殺手?

資料來源:MIT Technology Review
責任編輯:蘇祐萱

更多報導
「媽,我被綁架了!」AI只需要3秒偽造聲音,成詐騙新招!超真實哭腔你能分辨嗎?
Adobe推AI圖像工具Firefly,為何敢喊「你被告我來賠」?怎麼做到不侵權?