【觀點】宛如無盡圖書館宇宙!解析大型語言模型LLM的前世、今生與來世

從ChatGPT 開始的大型語言模型風潮,將人工智慧帶入一個新情境,由於語言模型的文字接龍特性,也將人工智慧的討論帶回文字語言甚至文學的世界中。1726 年的《格列佛遊記》裡有台拉格多城的書寫機器,是在眾多排列木塊的紙面寫上當地語言所有字母,40個鐵製把手靠人力轉動後,字詞排列配置便會改變,若文字隨機排列出現具意義詞句,一旁負責抄寫的人便進行紀錄。義大利小說家卡爾維諾(Italo Calvino)在 1967 年也提過寫作機器的概念,他認為寫作就是如何把一個文字放在另一個文字後的事,語言創作便是元素組合的操作,與大型語言模型的原理驚人地近似。

然後是阿根廷小說家波赫士(Jorge Luis Borges),魔幻寫實的祖師爺,9月底在 arXiv 這個論文預印平台上有篇新文章《波赫士與AI》(Borges and AI),第一作者伯托(Leon Bottou )是臉書的機器學習專家,他也是 DjVu 圖像壓縮技術的主要發明者。這篇論文透過波赫士短篇小說的世界觀,試圖指出大型語言模型的本質,以及它對人工智慧發展的真正意義是什麼。

想像一下,一個語言模型背後的訓練資料包括世上所有虛構小說、日常對話與我們說不出口概念的所有語言形狀,這個無窮排列組合的文字機器便是波赫士 1940 年代想的版本。
語言與技術在源頭上是同件事,技術史學家凱文.凱利(Kevin Kelly)在《科技想要什麼》書中談到語言在人類進步史上的意義,語言出現在製造工具與用火之後,帶來的躍進影響卻比工具大。語言讓人類清楚知道自己在想什麼,從此有意識的創造成為可能,透過複雜訊息的傳遞交流,發明與創新開始有了深思熟慮的目的,然後不斷迭代演進,例如地圖與鐘表的出現帶給我們對空間時間的抽象思維能力,這種抽象思維能力又轉化為語言去探索更抽象的技術概念。

這篇論文舉波赫士的小說《巴別塔圖書館》為例,小說構想一個龐大圖書館宇宙,由相鄰六邊形房間組成,書籍擺放是隨機的,內容也毫無意義,僅由25個字符任意排列而成,出生於圖書館的管理員們相信這裡包含每本已被寫過的書、將來會被寫出的書、各種翻譯或錯誤版本與包含所有書籍的目錄書。但這裡的任何有用資訊都會被埋沒在無用資訊中,對讀者完全無意義,許多管理員陷入絕望相繼自殺,另些管理員形成邪教藉占卜尋找書籍或開始毀壞他們認為無意義的書。

論文認為我們面對的大型語言模型就像這圖書館,具資訊與知識,但缺乏洞察與真相。波赫士的另篇小說《博聞強記的富內斯》談類似的事,富內斯可看見聽見世上一切,具眼花撩亂的偉大記憶力,但他很快陷入資訊超飽和的經驗主義地獄,因為沒有忘卻差異的抽象化能力,最後自然界的每件事物在他面前都斷裂為碎片,無法構成整體,語言單元變成無數發聲運動構成的無意義瀑流。

論文也提到另一篇小說《小徑分岔的花園》,有個一心寫龐大複雜小說與建造一個所有人都會迷路迷宮的雲南總督,他被刺殺後,德國漢學家發現那未完成的書與離奇消失的迷宮其實是同件事。因迷宮分岔指的是時間意義而非空間意義。在傳統小說中,若角色做出某個選擇便會抹煞其他可能性,但在這小說迷宮,事件的所有可能性會同時發生,每個發展都會進一步擴散更多可能性或再次匯聚,始終在迷宮花園裡循環。圖書館與花園描述的都是永遠分岔下去的無窮世界,讀者的詮釋將決定後續的多層敘事發展。

library 圖/shutterstuck
library 圖/shutterstuck

多重故事線超展開,不斷試誤生成出口

論文認為,在大型語言模型中,使用者的詮釋輸入與模型訓練,以及衍生的人機互動將為對話帶來結構與意義性,這種提示工程或訓練微調 (fine-tuning),可藉增加限制來引導未來的敘事發展空間,就像減去故事線或刪除花園歧路,可擁抱圖書館的巨量可能性,但同時降低資訊幻覺 (artificial hallucination)。大型語言模型與小說迷宮的另一差異是,小說的敘事者與主角無法試誤所有的故事分支可能性,但大型語言模型可不斷進行多重故事線探索,這是早在洞穴時代,書寫與印刷術被發明前的人類說故事能力;蘇格拉底曾擔心文字書寫會扼殺我們的記憶與創造,某種意義上是對的,但大型語言模型解決了這件事,我們可在花園中不斷試誤,直到這文字實驗讓路徑突變而產生迷宮出口為止。

這篇論文指出大型語言模型作為一種創造力工具的可能性,若與現有的創造力研究對話,顯然是合理的期待。以創意發生歷程眾多模型中的生成探索模型 (geneplore model) 為例,創意發生是先產生想法再迅速探索,進而再回饋引發新想法與新探索不斷迭代;這種先產生的想法是種「前發明結構」 (preinventive structures),是心理上的認知狀態,連文字都不是,也非真實存在世上的實體狀態,須持續餵養才能將初始狀態擴展成型,這與設計思考中問題解答共演化 (problem solution co-evolution) 的概念也很接近,大型語言模型若能藉對話以文字具象大腦認知狀態中的前發明結構,對這共演化進程的成形與發想效率,顯然會有幫助。

AI像烘焙、造花園,語言是創造力核心

若從創造力的物質化歷程來看,創意在具體成形前都會以文字語言或製造行為達成一定程度的物質化,這是設計師或發明家與社會的溝通探索過程,如此才能出現創意的預設用途 (affordance),賦予物品意義及用途的文化規範。實務上創意的原型製作測試都是這物質化歷程的一環,那麼,文字語言顯然是物質的前身,大型語言模型也許可藉文字脈絡將這物質化歷程推演至更前期而創造更好的創意生成銜接。

此外,從創造力的社會歷程來看,沒有任何創造是自孤立狀態完成的,即使過程中沒有與他人意見交換,創造者也必然受社會環境的啟蒙影響,這是創造力開發中強調腦力激盪與觀點取替 (perspective-taking) 的原因;大型語言模型是人工智慧,也是虛擬協作者,因此,人與語言模型的對話或迷宮花園的截枝取徑過程,其實也是個人與他者思維的碰撞過程,今日我們談專業生成內容 (PGC) 到使用者生成內容 (UGC) 到 AI 生成內容 (AIGC) 的內容協作進化,毋寧也是一種創造力社會歷程中的多元取徑進化。

ai 圖/shutterstuck
ai 圖/shutterstuck

在大型語言模型出現前,1998 年有本《電腦如何思考》,作者奚力思(Daniel Hillis)對通用型人工智慧提出預測,他認為創造人工智慧的過程比較不像建構一台機器,而像烘烤蛋糕或培植花園,我們不是製造人工智慧,而是營造一種讓智慧能顯露的適當環境,語言顯然是這座花園的可能性之一 (波赫士的花園巧合)。這論點呼應了技術史研究的看法,技術發展正變得愈來愈獨立,人不是技術的主人,只是技術的父母,技術是由其自身創造的,或說技術是自己的函數,像凱文.凱利發明的字「技術體」(technium),技術自成系統,透過自組織與正回饋而有突變進化。

在語言這座培植花園裡,日本設計師太刀川英輔的新書《進化思考》也指出這種語言與設計 (或說創新) 間的相似性,語言與演化一樣重複著變異選擇過程,並透過與環境交互作用進行分化優化,如果透過人為方式讓偶然的語言錯誤更頻繁發生,也許能提高創造性發生的機率。大型語言模型這自動機器顯然可操作這樣的突變實驗,我們都可想像智慧爆發的動力學概念,當資訊量超過臨界值,智慧便會指數成長,出現湧現能力,最終或可在某些機緣偶然 (serendipity) 下拓展認知邊界,跨進「未知的未知」(unknown unknown),在波赫士的宇宙裡,便能自未曾想過 (或原本不存在) 的小徑分岔走出花園,但過去我們無法進行這樣的創新實驗。

ai 圖/shutterstuck
ai 圖/shutterstuck

從哲學角度看,為何人類需要創造 ? 與動物的差異是,發揮創造性是人類展現能動性 (human agency) 的本質,我們面對環境不只是外部影響的被動接收者,而是主動參與者,然後才能在芸芸創意世界中找到自身位置。今日的人工智慧重新塑造了這樣的傳統認知,它既是影響我們的外部環境,也同時是我們用來展現能動性的工具。1967 年波赫士在哈佛大學諾頓講座談「隱喻」時,引用美國詩人康明斯(E.E.Cummings)的詩,與今日的大型語言模型有微妙近似,詩句說「因此我的生命 (就像是那太陽與月亮),也就模仿著一些從未發生過的事項」。

諾貝爾獎得主,也是人工智慧之父赫伯.賽門(Herbert Simon)的回憶錄提到,他對《巴別塔圖書館》與《小徑分岔的花園》等迷宮概念很著迷,曾於 1970 年到布宜諾斯艾利斯拜訪波赫士。在這場數小時訪談中,賽門問波赫士是否先有一個抽象概念,然後才用故事來示例這個思想;波赫士說不是,故事源頭是他曾在一座小圖書館待了9年,薪水低且同事難相處,他覺得整個人生都埋葬在這圖書館裡了,當時他讀了些排列組合理論,希望發明一個以無窮無盡圖書館為代表的宇宙,有歷史上所有曾被寫過的書,這激出了他內心最深處最本質的喜悅。

終於,現在我們有這座圖書館了。

責任編輯:蘇柔瑋