工具,還是對手? ——人工智慧與表演藝術的探索與角力

Cover Story|給麻瓜的AI使用說明書|介紹:AI 的過去現在與未來

《AI:當機器人寫了個劇本》提供= THEaiTRE
《AI:當機器人寫了個劇本》提供= THEaiTRE

文字 本刊編輯部

如果有隻鸚鵡能回答任何問題,我將毫不猶豫宣稱牠是智慧生物。

――狄德羅(Denis Diderot)

信不信由你,人工智慧(artificial intelligence,AI)與表演藝術的糾葛已超過百年——在捷克劇作家卡雷爾.恰佩克(Karel Čapek)1920 年的作品《羅梭的全能機器人》(Rossum's Universal Robots)中,「機器人」(robot)一詞首度被用來描述這種外型似人,擁有與人類相同思考與行動能力的機械;而劇作中機器人原本設計來服務人類,卻「覺醒」而導致人類毀滅的設定,也成了後世科幻作品對人工智慧的經典想像:從《2001 太空漫遊》的 HAL 9000 到《魔鬼終結者》的天網,機器一旦開始思考,毀滅人類似乎總是它們的首要任務。

如果我們把人類到底多不該存在先放一邊,這類故事原型正好讓我們一窺大眾對 AI 的終極想像:它們能理解回應世界的變動並解決沒有標準答案的問題,最終甚至可能演化出自由意志而做出(就人類看來)叛逆的決定。這種能像人一般認知、思考、學習的 AI,稱作通用人工智慧(artificial general intelligence,AGI)或強人工智慧(strong AI)。

黑盒子中的秘密:人工智慧是如何產生「智慧」?

AGI 一直是 AI 研究領域的終極聖杯,現階段 AGI 離實現也還有段距離(註1);目前日常生活可見的 AI 多是另一種思維的產物:機械無需「真的」有智慧,它們只要能執行所謂的「智慧型任務」就可以了;比如在停車場出入口辨識車牌、在海關驗證身分、自動或輔助汽車駕駛等等。這類 AI 被稱作應用人工智慧(applied AI)或弱人工智慧(weak AI),基本上只能在人類的明確命令下執行單一任務,於此範疇外,則通常一無所知。儘管如此,弱人工智慧仍不時震驚世人,特別在弈棋這個常跟「智力」聯想在一起的領域——比如 1997 年深藍擊敗西洋棋王卡斯帕洛夫,或 2016 年 AlphaGo 擊敗圍棋九段李世乭。但不論 AlphaGo 圍棋下得再好,不經過重新訓練,它並無法直接與人對弈其他棋類,更別說執行下棋以外的任務。

2022 年以前,強弱人工智慧的區別仍相當明顯,但隨著以 ChatGPT 為首的生成式 AI (generative AI)(註2)進入大眾視野,兩者邊界似乎變得有些模糊——能有模有樣回答幾乎任何問題的聊天機器人,狄德羅會毫無疑義認為它們有智慧嗎?就算我們把「谷歌停職員工聲稱 AI 有靈魂」或「聊天機器人向紐時專欄作家瘋狂示愛」這類驚悚故事只看作花邊新聞,2023 年 5 月一則貨真價實的研究報告指出:在一項超過 150 萬人參與的線上測試中,玩家能在兩分鐘聊天時間內,正確辨識機器人的準確度只有 60%——只比二選一瞎猜的 50% 機率好上一些。(註3)

即使幾乎騙倒人類,許多主流 AI 研究者仍認為 ChatGPT 等一眾聊天機器人不過只是能唯妙唯肖模仿人類的「隨機鸚鵡」(stochastic parrots)——它們並不理解自己在說什麼,只是根據學習過的巨量文本照樣造句。然而也有另一派聲音主張,真正的「理解」並不存在,「我們都只是隨機鸚鵡」(註4),智慧是結果,不是源由——根本上,這就是自柏拉圖以來即一直莫衷一是的「二元論」爭辯的延續。

有趣的是,近年 AI 發展所仰賴的基礎模型,仿似針對這道經典哲學難題的模擬實驗:這種稱作類神經網路(artificial neural network)(註5 )的演算模型,試圖在物理機制上模仿大腦的運作,它們由巨量的神經元與突觸構成複雜的多層網路結構,並藉由大量訓練素材,透過回饋機制增強或抑制突觸的強度,來進行「學習」(註6)。2010 年後隨著硬體運算能力的成長以及「深度學習」(deep learning)演算法的發明,類神經網路得以突破規模限制,達到接近人腦的複雜程度,從而展現出驚人的理解及回應能力——不過遺憾的是,這不表示數千年來的難題已然得解——就像解剖人腦沒法找出智慧的源頭,我們也無法透過分析類神經網路得知它們如何(或有沒有)產生智慧:神經網路「學會」的知識或思想,分布在數以百億計的神經元以及數以兆計的突觸組合裡,分析此等數量級的綜合行為,基本上是不可能的任務。

生成式AI創作,現正進行中

不管 AI 是否真有智慧,會不會有天(有意無意)毀滅人類,對一般大眾來說,這大抵還是件「交給大人去煩惱的事」,畢竟光是日常生活可見的衝擊,就已十足令人憂心——想想網紅的 deepfake 換臉事件,人類在道德灰色地帶學習新工具的速度,只怕 AI 看了也瞠目結舌。而生成式 AI 對創作本質的動搖,更引起許多創意工作者的憂懼。創作曾被認為是人類智慧最重要的堡壘(想想創作牽涉多少不同的心智活動,認知、共感、表達、判斷⋯⋯),現在卻受到前所未有的挑戰——從 2022 年遊戲設計師傑森.艾倫(Jason M. Allen)以 Midjourney 繪製的畫作《歌劇院空間》(Théâtre D’opéra Spatial)獲得比賽首獎,引爆「AI 創作到底算不算藝術」的論戰;到 2023 年好萊塢大罷工,ChatGPT 被認定是編劇工作權的重大威脅——這些爭議,尚且是在創作者普遍認為 AI 創作能力還遠不及人類的情況下發生的,而隨著 AI 的突飛猛進,創作者又將面對怎樣的未來?

另一方面來說,從古希臘的機器神到當代的 VR 藝術,新科技所帶來的新工具、新媒介、與新生活型態,往往激發更多創作的素材與創意的可能。利用 AI 來創作已是行之有年的嘗試:AI 作曲軟體 AIVA 早在 2016 年便得到法國 SACEM 認證,成為世界上第一個被版權機構認證的虛擬作曲家;AI 編舞的歷史更加悠久,1960 年代便有第一套 AI 編舞工具出現,近年來則有匈牙利編舞家瓦倫西亞.詹姆斯(Valencia James)的 AI_am 計畫、英國編舞家韋恩・麥奎格(Wayne McGregor)跟 Google 合作的 Living Archive 計畫等等,從不同面向探索 AI 輔助編舞的可能;而 2021 年,AI 也在捷克完成了第一個登台的編劇作品,《AI:當機器人寫了個劇本》(AI: When a Robot Writes a Play)(註7),作為佩恰克的機器人劇作誕生百年的慶祝活動,此劇以現場直播的方式,於疫情期間在線上首演。

美國劇場導演安妮.多森(Annie Dorsen)可能是最早利用 AI 作為媒材的創作者之一:多森從 2010 年開始與程式設計師合作,創作了一系列以 AI 為主角,稱作「演算法劇場」 (algorithmic theater)的作品。系列首作《哈囉你好》(Hello Hi There)唯二的「演員」是兩台筆記型電腦,它們安坐在長滿青草的土堆上,每晚即興漫談著人性,內容場場不同。(註8)AI 行為難以預測的特質,也成為許多後繼者利用的素材,從英國楊維克劇院(Young Vic Theatre)2021 年推出的《AI》,到 2023 年在紐約外百老匯登場的音樂劇《毛皮與啟示錄》(Fur and Revelations),AI 各自在現場扮演即興創作文本或音樂的角色;2022 年在德國上演的歌劇《逐流人生》(Chasing Waterfalls)更是一口氣集上述大成——AI 不僅共同撰寫文本、音樂,還在場上擔任演員╱歌者(註9);全劇更包含4分多鐘的即興片段,完全由 AI 現場作曲、演奏、演唱完成。

藝術產製的未來會發生什麼事?

儘管身為 AI 創作的先行者,多森對 AI 入侵的前景卻十分悲觀。在 2023 年結合 ChatGPT 創作的最新講演(lecture performance)作品《盜火者普羅米修斯》(Prometheus Firebringer)演出後,多森甚至表示:「即使目的是為了批判它們,我對使用這些工具來創作依然感到矛盾,我懷疑我以後還會這麼做。」

2024 年 1 月新出爐的研究則捎來更不祥的訊息:這項針對近 2800 位頂尖 AI 研究者的調查(註10)顯示,平均來說,研究者預測 AI 在 2027 年便能模仿特定作曲家寫出新曲,到 2030 年,AI 便可能寫出登上《紐約時報》排行榜的暢銷小說。且莫驚慌(或欣喜)——暢銷小說未必等於深刻的藝術,就像好萊塢罷工現場的抗議標語所言:「ChatGPT 沒有童年創傷」(註11),藝術家擔心的或許不是 AI 能創作出曠世巨作,而是 AI 依循娛樂化公式大量產出,沒有深刻意義與價值,甚至徒具某種模仿風格的作品,將會劣幣驅逐良幣;而由 AI 模仿的廉價「贗品」,甚至可能排擠正牌藝術家的生存空間。

或許 AI 創作的大舉入侵無可避免,但我們不妨換個角度想想(或至少安慰自己)——AI 可能可以製造出唯妙唯肖,教宗穿羽絨服的照片,但它們會覺得這些照片有趣,乃至起心動念去「創作」它們嗎?這也許是 AI 天生的缺陷——對沒有肉體,生命近乎無窮與不朽的 AI 來說,真可能共情人類,對天地悠悠生老病死愴然涕下嗎?當然 AI 仍在飛速發展,一切言之尚早;但假設在創作動機與美學觀點上,AI 終需人類的詠唱與召喚,那真正會天翻地覆的或許不是創作,而是創作的產程:隨著創作門檻降低,藝術創作將會更加去菁英化及普及化——許多傳統職位會消失,但大眾或許會迎接創意更加百花齊放,人人都能成為藝術家的未來。

(註)

  1. 某些樂觀的預測認為 2030 年 AGI 有機會實現,而如何監管 AGI 不至於毀滅人類,當然也是學界當前如火如荼的研究課題。

  2. 生成式 AI 的訓練重點在於如何產生內容;相對來說,像前述的車牌辨識或棋類應用,則專注在訓練 AI 如何「做出正確決定」,後者通常被稱作判別式 AI(discriminative AI)。

  3. 這項由以色列公司 AI21 Labs 進行的研究基本上實作了人工智慧領域最經典的思想實驗:「圖靈測試」(Turing test),在 1950 年由20世紀最重要的數學家及計算機科學家之一——艾倫・圖靈(Alan Turing)提出,原論文中稱之為「模仿遊戲」(那部以圖靈為主角的電影便是依此命名);其假設是:「若一台機器能透過傳輸裝置與人類對話而不被辨識出身分,便可稱其具有智慧。」換言之,只要一具機器看起來有智慧,那麼它便是有智慧的。

  4. OpenAI 的執行長 Sam Altman 在 ChatGPT 推出5天後在推特上說:「我是一隻隨機鸚鵡,你也是。」

  5. 不論是 ChatGPT 使用的大語言模型(large language model,LLM)或是 Midjourney 使用的生成對抗網路(generative adversarial networks,GAN),都是建立在類神經網路上頭。

  6. 相對來說,早年的 AI 發展,大多建立在「模仿人類的理性思考」上,比如透過預先編寫好的的規則進行決策,或藉由統計模型及訓練資料學習特定情境與模式。其中一個主因是人腦太複雜了——在電腦硬體的能力及相關理論模型尚未成熟時,模擬人腦不論在理論或實務規模上都不可行。

  7. 在戲劇構作 David Košťák 提供的場景設定與台詞引導下,整個劇本大約有 90% 的台詞由稱作 THEaiTRobot 的 AI 工具生成。這個工具建立在 ChatGPT 的前代模型 GPT-2 上,theaitre.com 有提供免費試用,以及此劇本的全文下載。

  8. 當年當然還沒有 ChatGPT 甚至其前身,多森與研究者使用的是早期 AI 的方法,預先編寫規則,讓聊天機器人能根據上文選擇對話,進行即興對談。值得一提的,AI 的談資主要取材自 1971 年傅柯與喬姆斯基關於人性的經典電視辯論,再加上莎士比亞、聖經,及 YouTube 的影片評論等等。

  9. 透過影像呈現。

  10. 《數千位 AI 作者談 AI 的未來》(Thousands of AI Authors on the Future of AI ),刊登在該月的《電腦與社會》(Computer and Society)期刊上。

  11. 編劇的內部笑話,意指沒有童年創傷,就寫不出好劇本。