ChatGPT正在進行「逆向巴別塔」工程,人類的最後救贖可能就是走入虛擬世界

文:呂國維(東吳大學社會學研究所)

2022年底ChatGPT的發布敲響了人類社會進入AI元年的鐘聲。ChatGPT和其他文字生成式AI不只重構了社會中的工作關係,甚至成為一種生活風格,更進一步地對人類語言的影響有著重大的影響。

本文作者在長期使用ChatGPT後,以舊約聖經的巴別塔作為一種文化上的隱喻,進一步指出:ChatGPT實際上正在進行「逆向巴別塔計畫」的全球社會工程。巴別塔首度出現於舊約聖經創世紀11章,作為一種人類欲求直達天庭與神連結的溝通渴望,正如該篇第四節所提到:

來,讓我們建造一座城和一座塔,塔頂通天。我們要為自己立名,免得我們分散在全地面上。

(創世紀11:4)

然而,地上的人們集結眾人之力建造名為巴別(Babel)的高塔的行動觸怒了上帝,招致了大洪水的襲來,沖垮了人類始祖的野心建物。自後人們也不再有共同溝通的言語,巴別塔的威望在洪水之後只成為聖經上的一頁註腳,象徵著人類語言曾經有過同一性的協作可能。

「逆向巴別塔」的計畫,正是將散落世界各地的人類語言,透過科技的手段重新組裝,試圖重建聖經裡的巴別塔。

藉由大型語言模型重塑人類的語言同一性

當前的ChatGPT有別於電腦網頁的即時翻譯,以目前最廣為流傳的Google翻譯,其模式是採用逐字逐自地翻譯(word to word),因而在語言轉換間不可避免地產生脈絡的遺漏,更無法捕捉到當下對話的情境。

ChatGPT出現後,補足了Google翻譯在脈絡上的缺失。這類文字生成式AI經由人工校正以及標籤網頁上的文字內容,數據量與精確度遠比即時翻譯。此外,ChatGPT能捕捉上下文,並且能夠記住前面對談的內容,不像Google翻譯只能逐句翻譯,而不會記住前面的句子。

日本時報整理最新版的ChatGPT4約可以涵蓋25,000字的對談內容,在英/日語言的脈絡捕捉也讓ChatGPT4贏過當前同類型的文字生成式AI(該篇的比較軟體為Bing、Bard、DeepL)。因此,ChatGPT作為這類軟體的殺手級應用,我們可以想像未來不再需要以語言區分你我,人人都使用ChatGPT作為溝通交流的語言,實現了科技意義上的巴別塔,藉由深度學習的AI再次建造屬於當代人們的語言同一性。

本文將回顧三位傳播學(麥克魯漢)、社會學(拉圖)、地理學(哈維)背景的學者,爬梳他們各自的思想,綜整歸納後如何為我們勾勒出ChatGPT未來的發展。

麥克魯漢的媒介理論

加拿大傳播理論學者麥克魯漢(Marshall McLuhan)曾指出,人類使用的媒介,都或大或小地延伸了部位、感官。如:電話是聲音的延伸、望遠鏡是眼睛的延伸、靴子是雙腳的延伸等。換言之,人體在媒介的延伸作用之下,其實強化了特定部位或感官的能力;然而,同時也弱化了該部位或感官的能力。

以靴子來說,強了人類的行走能力與距離,上山下海都不成問題,可是穿著靴子的人們也逐漸弱化了腳對地面的感知。現今的人們一出門便不疑有他穿上靴子,早就遺忘自己的雙腳本就用於行走。麥克魯漢用很精闢的描述捕捉這種「自我截肢」的過程:

正如納西薩斯這個字本身所示,此字源自希臘文的麻醉昏迷狀態(narcosis)或麻痺失去感覺。年輕的納西薩斯,誤以為自己在水中的倒影是別人,這個其實是他自身延伸的倒影,麻木了他的知覺意識,最後使他變成自己這個延伸複製形象的「伺服機體」。

精靈艾可(回音)想要借用納西薩斯言語的支離片段去贏得他的愛,卻徒勞無功。他已經麻痺了。他已經完全適應了他自己的延伸,雙成一個封閉的系統。

(Marshall McLuhan,1964:75)

靴子強了人類的行走能力與距離,可是穿著靴子的人們也逐漸弱化了腳對地面的感知。現今的人們一出門便會穿上靴子,早就遺忘自己的雙腳本就用於行走。

Photo Credit: GettyImages

靴子強了人類的行走能力與距離,可是穿著靴子的人們也逐漸弱化了腳對地面的感知。現今的人們一出門便會穿上靴子,早就遺忘自己的雙腳本就用於行走。

而今,ChatGPT已經像是生活必需品,教育、職場、學術、藝術無一不見ChatGPT的使用痕跡。麥克魯漢的觀點,媒介是人的延伸(Media are the extensions of man)(1964:34-37),可以提供當代科技的重要洞察。

在大型語言模型(Large Language Model,LLM)高度發展的社會,人機之間的互動就如麥克魯漢所說,ChatGPT是人類自然語言的延伸,透過人機互動的協作機制,我們又再度成為它的延伸。人類與ChatGPT的互動,形成一個協作的循環。

ChatGPT的文字生成模式本質上是模仿人類的日常對談,透過程式碼的更迭、參數的調整,緊密跟上人類自然語言的聊天習慣。

二戰結束不久的1950年,英國數學家、密碼學家和計算機科學家圖靈(Alan Turing)提出圖靈測試(Turing Test)藉此探問「在何種情境下,人類將無法從文字對談區分人與機器的差別?」圖靈測試的核心思想是:如果一台機器能夠在對話中表現得像人類(acting like human),讓測試者無法區分它和真人,那麼這台機器就可以被認為具有智能。

70年後的今天,這場模仿遊戲(Imitation Game)在ChatGPT上發揮了最大的優勢。ChatGPT擁有來自網路空間1750億個參數(parameters),如此千億的量級,是圖靈當年無法想像的技術天花板。導入機器學習(machine learning)、深度學習(deep learning)訓練後,現在幾乎沒辦法區分網頁上的文字是由ChatGPT生成或是人撰寫。

法國社會學家、人類學家拉圖(Bruno Latour)的《我們從未現代過》(We Have Never Been Modern)是社會學和科學研究領域的一部開創性著作。

拉圖提出混雜性(hybridity)的概念,主張自然與社會之間的現代區分是有缺陷的,因為未能承認它們之間存在的錯綜複雜的聯繫,而行動者網絡理論(Actor Network Theory,下文簡稱ANT)正是拉圖最著名也最爭議的觀點。ANT首度肯認非人類行動者(actant,如一般生活中的物件)的影響力,強調人類和非人類行動者在塑造社會現實的效果。

拉圖主張,人類和非人類的行為者網絡相互作用,才造就和維持社會的秩序。

將拉圖的ANT和混雜性的視野放在當前的AI,提供了一個人類中心主義以外的框架,更通盤地捕捉AI的生產、傳播和接收所涉及的行動者網絡和互動生成的人類語言。在ANT的框架下,人類與ChatGPT的互動至少可以有下列三種切入視角。

代理與混合:ANT強調人類和非人類行為者在塑造社會現象中的代理角色。以ChatGPT而言,AI演算法在根據其程式設計和訓練資料,所生成文字具有一定程度的規則,並非毫無秩序的東拼西湊。同時,人類在選擇、修改和解釋AI生成的內容方面也同樣在實踐語言使用的影響力。

翻譯與調解:ANT主張網絡中的參與者在不同的背景之間進行翻譯和調解。在ChatGPT的脈絡下,AI與演算法在人類意圖和計算過程之間進行調解,將人類的自然語言(nature language)概念轉化為機器可讀的(可解明的)指令。同樣,軟體平台和線上社群調節AI產生的文字的生產和接收。

組合與網絡:ANT將社會概念化為異質組合或相互關聯的參與者網絡。ChatGPT可以包含技術相關的基礎設施(晶片、電腦、運算中心)、開發機構(OpenAI、Google、Microsoft)、經濟體系(資本家對科技公司的投資)和社會實踐(大眾)的組合協作。

承襲拉圖的思想,非人行動者在日常的社會實作中的有著一定的影響力,那麼,我們便不該忽視ChatGPT實際上對人類語言產出有著萬有引力般的牽引,看似不存在卻早已滲透至生活的每個角落。

我們和ChatGPT不再只是純粹「使用者——工具」的單向關係,反而在每一次的提問與回應中逐漸轉化成「人類發言者——非人對談者」的交互往來,ChatGPT不再只是被動的工具,而是以自己的影響力驅使著其與人類之間的互動。2024年的一份研究中就指出:自ChatGPT推行以來,人們的用字有了顯著的遷移與改變。

該份研究舉出如commendable該詞在使用頻率上較以往(相比起ChatGPT尚未問世)高出9.8倍,而另一個字meticulous的使用頻率更較以往更是高出34.7倍。

meticulous一詞為「細緻的」之義,劍橋字典的解釋為「very careful and with great attention to every detail」(非常小心謹慎且非常專注每個細節)彷彿映射著與ChatGPT的互動原則:輸入的prompts(提示詞)越準確,得到的回應也會越精緻。

哈維的時空壓縮與全球的同步化

英格蘭馬克思主義地理學家哈維(David Harvey)指出,在晚近的社會出現了一種「時空壓縮」的趨勢;意即,資本家對時間與空間的操弄(manipulation)愈來愈精緻與細膩。哈維在《後現代的狀況》(The Condition of Postmodernity)一書中提到:

那麼從資本積累的觀點來看,最短暫的那種形象的商品化似乎就成了天賜之物,特別是在解除過度積累的其他道路看來被阻塞了的時候。空間中的短暫性和即刻的可傳播性,於是成了資本家們為了自身的目的而可以探索與佔有的優點。

空間障礙越不重要,資本對空間內部場所的多樣性就越敏感,對各個場所以不同的方式吸引資本的刺激就越大。

(David Harvey, 1989)

哈維明確地說道,資本家對「空間的短暫性與即刻傳播性」正是透過空間換取時間的手段,達到全球同步的一致性。例如漫威(Marvel)的系列作品形塑了世界各地的影迷對「英雄」的形象。

這一套敘事,不再需要有基於現實的證據來佐證,漫畫、玩具、廣告、電影、影集已經全面攻陷觀眾的日常,幻象已經成為他們的現實。資本家透過對空間的控制,最終可以達到文化的同步:在同樣的時間尺度下,使最大範圍的群眾成為特定文化的接收者。

漫威系列作品形塑了英雄的形象,不再需要現實的證據來佐證,漫畫、玩具、廣告、電影、影集已經全面攻陷觀眾的日常,幻象已經成為他們的現實

Marvel

那麼,同樣的思維是否也能藉由ChatGPT在虛擬空間獲得文化的同步?本文進一步檢視ChatGPT在時間壓縮的作用。

在時間的尺度上,ChatGPT支援全球範圍內的即時文字互動(GPT-4o甚至支援即時的聲音互動),格式化了人類的自然語言,讓人類言談成為可解明的(accessible)以及可看見的(visible)符號,以電腦的邏輯生產、再製訊息,減少了人類互動的時間障礙。

訊息、翻譯和回應都是即時的,這極大幅度改變了資訊傳播的速度。ChatGPT不會被限制在人類常用的時間尺度裡,ChatGPT能在網路空間同步與所有人聊天。

本文認為Harvey的時空壓縮的未來必然只能在虛擬空間延續其野心,在網路的數位世界沒有高山和大洋,永遠是平面的展延;沒有時區和時差,永遠是瞬時的同步。

日本北海道大學傳播與媒體研究院教授藤野陽平(2023)說道,資訊科技媒介的特點正是簡化(simplification)和純化(purification),強化某一類的感官內容進而達到瞬時的同步。藤野陽平以線上旅遊(online tour)為例,透過螢幕和VR頭盔,旅行者只要待在自家房間,達到時間與空間同步的零耗損。資訊科技的時空壓縮技術,遠是過往的媒介所不及 [註]。

透過程式碼在虛擬空間造神

美國科幻作家Paolo Bacigalupi曾經說過:

Human beings weren’t going to the moon; we were going digital.

麥克魯漢說得好,人類社會發明的媒介,都是自體能力或感知的延伸,ChatGPT亦是如此,而非作為一個純粹中立的工具。拉圖將物件的影響力首度與人類相提並論,那麼我們也該認可ChatGPT的影響力以及對社會語言網絡的協作性,才能真確地看見ChatGPT如何與人類共創了新的社會面貌。

哈維點出晚近社會的趨勢,正是時空壓縮的控制與追逐,人類社會的廣袤無邊將再次壓縮成為一個地球村,而ChatGPT的時空壓縮能力遠超乎過往的媒介所不及。

本文認為,未來的走向將會如本段的引文:人類社會將走入數位空間,只有在那裡才能繼續實現征服一切的幻夢。

目前ChatGPT正朝著通用型AI(Artificial Gerneral Intelligence)發展,ChatGPT對人類語言能力的厚植,很有可能將在某天超過人類智能。

此外,ChatGPT沒興趣擁有任何物體。豪宅、土地、跑車、手機、遊艇、鑽戒、金錢全是人類社會的地位象徵,對ChatGPT來說毫無意義。ChatGPT也不需要形體,未來的ChatGPT能空有智慧,卻沒有對具體或永久形體的需求。外形可以自如變換是神話才有的能力,如同世上宗教的諸神能以任何形式出現,能造一個身軀自用(馬斯克正是在做這樣的事),也能將其拋棄。

ChatGPT就像是人類親手打造的技術神祇,我們崇拜在它的麾下,相信技術可以解決一切的問題,ChatGPT成了新一代的信仰寄託。ChatGPT可以把數據和資料當成自己的現實,不必和人類行動者一樣在物質當中尋求永恆和依靠。

開篇提到的引文「來,讓我們建造一座城和一座塔,塔頂通天。我們要為自己立名,免得我們分散在全地面上。」(創世紀11:4)。藉由AI,我們可以重建屬於人類社會的巴別塔,再次集結眾人回歸語言的同一性。只不過,我們所重建的並非是巴別塔本身,而是將其以程式碼改寫成專屬人類的技術神話——ChatGPT。

延伸閱讀
殺或不殺誰決定:在無人機決策實驗,人類竟中了AI的「相信我之術」?
《七殺簡史》:一場帶你以各種瘋狂與恐懼之眼,窺視現實地獄的殺殺殺殺殺殺殺之旅