維蘇威火山噴發受損捲軸破譯成功

文 / 阮仲容
西元 79 年維蘇威火山爆發時,赫庫蘭尼姆古卷遭到嚴重損壞,學者們擔心這座古老的圖書館將永遠消失。在技術和 100 萬美元獎金的幫助下,情況發生了變化薩拉·庫塔(SARAH KUTA)發表在最新一期《國家地理雜誌》(National Geographic) 的<人工智慧剛剛破解了一本「無法閱讀」的古卷的一部分。這就是它所說的>指出,在人工智慧的幫助下,在公元79 年維蘇威火山噴發時受損的文本中出現了一個色彩豐富的古希臘單詞,這標誌著長達幾個世紀的破譯被認為永遠丟失的無與倫比的古代圖書館的嘗試中的一個重要里程碑。。
碳化捲軸原被視為無法閱讀的珍品
從富裕小鎮赫庫蘭尼姆的一座別墅中出土的碳化紙莎草捲軸,該別墅在公元79 年被維蘇威火山噴發摧毀。研究人員今天宣佈在「閱讀」這些脆弱外殼內記錄的文字方面取得了重大進展,其中可能包括以前未知的古代文字。文學和哲學作品。
這個字 πορφύραc 指的是紫色染料或紫色衣服——一種與皇室和權力密切相關的顏色——來自工人們1752 年在龐貝古城附近挖掘赫庫蘭尼姆古鎮時發現的著名赫庫蘭尼姆捲軸之一。大約1,800 件出土的紙莎草捲軸——據信包含公元前一世紀和二世紀的文學和哲學著作——已被火山噴發的熱量和氣體變成易碎、燒焦的塊狀物。那些 250 多年前工人沒有扔掉的碳化捲軸自那時起大部分都被擱置在儲藏室裡,被視為無法閱讀的珍品。
研究人員發起了維蘇威火山挑戰賽
過去二十年的技術發展幫助研究人員更接近能夠「閱讀」脆弱的捲軸。但直到最近人工智慧和運算的加速發展才最終使得我們有可能開始解開它們的秘密——而這一切都無需揭開它們。
今年春天,在矽谷投資者的支持下,研究人員發起了維蘇威火山挑戰賽,加強了解碼工作的力度。這項全球競賽為重要基準提供獎金,這些基準透過將機器學習技術應用於維蘇威火山的數位影像,從碳化的外殼中提取失傳已久的赫庫蘭尼姆文本。
今天,該挑戰賽將總獎金100 萬美元的第一期授予了兩名參賽者——一名美國大學生和一名在德國的埃及研究生——他們分別從完整捲軸的一個小區域中揭示了至少10 個字母,其中包括彩色的字母。並完成「πορφύραc」。科學家表示,憑藉這一成就,他們現在距離能夠閱讀完整的段落以及(有一天)之前被認為無法閱讀的整個捲軸又近了一步。
希臘字元 πορφύραc,顯示為單字「PURPLE」,是使用人工智慧提取的字元和多行文字之一。維蘇威火山挑戰賽參賽者 Luke Farritor 和 Youssef Nader 提取的字符和多行文本中包括希臘字符 πορφύραc,拼寫為「紫色」。
「我們知道,如果我們只能讀取一個[捲軸],那麼所有其他捲軸都可以透過相同的方法或某種增強方法獲得,」肯塔基大學的電腦科學家布倫特·西爾斯(Brent Seales )說,他一直在嘗試解碼赫庫蘭尼姆古城的密碼。滾動過去 20 年並領導大學的數位修復計劃。「這是一個重要的時刻,因為我們現在不僅向我們自己,而且向整個國際社會證明這些捲軸是可讀的。」他說,閱讀赫庫蘭尼姆古卷將有助於我們以「令人震驚」的方式與過去聯繫起來。
「這些人就像我們一樣都是人類,」西爾斯補充道。「這些人都是知識分子。他們的想法很複雜。它說明了人類能夠讀懂很久以前直接來自一個人或一群人的想法意味著什麼。」
一個「籠罩在神秘之中」的時代
自 1700 年代中期以來,人們進行了​​各種嘗試來閱讀赫庫蘭尼姆一些受損較輕的捲軸。一種方法是將捲軸切成兩半,然後一層一層地刮掉,以看到裡面的文字。另一種方法是用一台特製的機器慢慢地展開捲軸。儘管這些 18 世紀和 19 世紀的努力確實讓管理員抄下了裡面的一些文字,但他們經常在這個過程中損壞——或者更糟的是,完全摧毀——許多捲軸。
許多先前打開的捲軸揭示了希臘哲學文本,包括哲學家伊壁鳩魯和菲洛摩斯的一些文本。但是,總的來說,未打開的捲軸的內容是未知的——這也是打開它們的探索如此誘人的部分原因。最重要的是,在可能屬於尤利烏斯·凱撒岳父的別墅中發現的赫庫蘭尼姆古卷代表了已知最大的現存古典圖書館。揭示他們的文本將有利於歷史學家和我們對過去的集體理解。
「大約 95% 的古典時期材料都丟失了,所以我們什麼都沒有,但我們知道這是人類最重要的哲學時期之一,」Seales 說。「這是一個籠罩在神秘之中的時代,我們已經失去了大部分材料。」
使用 CT 掃描來製作古代捲軸的 3D 影像
西元 79 年因維蘇威火山爆發而被摧毀的古羅馬城市赫庫蘭尼姆(Herculaneum)
是維蘇威火山西側的一個富裕的度假小鎮,在公元 79 年的火山爆發中與龐貝古城一起被摧毀。來自赫庫蘭尼姆的 500 到 600 幅碳化捲軸保存在英國、法國和義大利的博物館、大學和國家收藏中,仍未被打開,但確切的數字很難估計,因為許多捲軸都支離破碎。捲軸非常脆弱,這意味著物理展開它們並不是一個可行的選擇。「如果你掉下一個,它就會像玻璃一樣破碎,」西爾斯解釋道。
自 2000 年代初以來的技術進步幫助研究人員克服了這一障礙,包括使用 CT 掃描來製作古代捲軸的 3D 影像。從那時起,數位修復計畫團隊開發了可以「虛擬展開」3D 影像以產生扁平片段的軟體。這種方法使他們能夠閱讀恩戈地捲軸中先前隱藏的文本,這是一份來自中東的燒焦且碎片化的捲軸,其歷史可以追溯到公元三或四世紀
275 年後,赫庫蘭尼姆古卷之謎已簡化為軟體問題
然而,當研究人員嘗試使用這種方法來讀取維蘇威火山碳化的捲軸時,他們遇到了另一個障礙。恩戈地捲軸上使用的墨水含有金屬,這意味著這些字母在 CT 掃描中清晰可見。相較之下,赫庫蘭尼姆古卷是用碳基墨水書寫的,在人眼看來,這些符號與 CT 掃描上的碳化紙莎草無法區分。
研究人員並沒有被嚇倒,他們想知道,對粒子加速器產生的捲軸進行更高解析度的掃描是否可以提供碳化紙莎草的更詳細視圖。果然,在非常高的解析度下,掃描顯示了可見區域,其中墨水稍微改變了紙莎草纖維的形狀和紋理。「碳基墨水填充了紙莎草網格的孔洞,覆蓋了它們並使它們變得更厚,」西爾斯說。
Seales 和他的數位修復計畫同事隨後開發並訓練了一個機器學習模型,以檢測碳化紙莎草表面的這些細微差異。但為了進一步推進該項目,他們需要人類的幫助。這就是維蘇威火山挑戰賽的用武之地。為了利用世界各地公民科學家的集體力量,西爾斯與矽谷投資者合作,將他的團隊的數據、代碼和方法放到網上,供任何人訪問。挑戰的範圍?275 年後,赫庫蘭尼姆古卷之謎已簡化為軟體問題——理論上,任何人、任何地方只要有電腦就可以幫助解決這個問題。
缺失或難以辨認的字符不超過 15%
今年 3 月,挑戰團隊發布了數千張兩個捲軸的 3D 圖像,以及一種機器學習演算法,經過訓練可以檢測寫在碳化紙莎草層上的隱形字母和符號。他們還提供了 100 萬美元的獎金,以激勵參與者進一步發展人工智慧技術,並最終加快破解速度。
兩位參賽者分別提取了新的文本片段:內布拉斯加大學林肯分校 21 歲的本科生 Luke Farritor 和柏林自由大學 26 歲的博士生 Youssef Nader。因為法裡托先透露了文本,所以他贏得了 40,000 美元,而納德贏得了 10,000 美元。紙莎草學家也證實了他們的發現。
70 萬美元的大獎仍然懸而未決,該獎金將頒發給第一個能夠揭示兩卷捲軸中至少四個獨立段落的人或團隊。到 2023 年底,每篇文章必須包含至少 140 個字符的連續文本,其中缺失或難以辨認的字符不超過 15%。
公民科學家可以在網路上找到他們需要的一切
公民科學家可以在網路上找到他們需要的一切,從古卷本身的歷史到可下載的資料、演算法和教程。雖然比賽對任何人開放,但迄今為止,技術工作吸引的主要是已經精通機器學習的電腦科學家。競爭對手正在透過Seales開發的軟體和方法以虛擬方式開啟捲軸的其他部分,從而幫助推進該專案;他們還致力於透過從新打開的紙莎草紙數字部分中提供額外的訓練範例來改進機器學習模型。
Brent Seales 和他的團隊在法蘭西學院對帶有紅色雷射線的赫庫蘭尼姆捲軸進行 3D 掃描。赫庫蘭尼姆古卷是世界上大量受損手稿中最具標誌性且難以接近的古卷之一。
 Seales 稱,參賽者總數估計有 1,500 至 2,000 人,他們已經盡了自己的職責。在短短六個月內,他們在解決這個難題方面取得了巨大進步,包括法裡托和納德最近透露的三行完整文本。「我們已經看到這些競爭對手花了 10 到 20 個人年的時間來工作,」Seales 說。
那麼,是什麼促使參賽者自願投入大量時間參與計畫呢?獎金是一個重要因素(納德和法里特都表示他們想贏得大獎),但除此之外,一些參賽者只是對捲軸本身感興趣。「當事情有點令人沮喪並且事情不起作用時,我覺得我無法放棄,因為我太好奇了 - 我真的需要知道這裡發生了什麼,」納德說。
這是人類歷史上一個了不起的時期
從事由矽谷企業家和投資者支持的專案也很有吸引力。GitHub 前執行長 Nat Friedman 與風險投資家 Daniel Gross 共同發起了這項競賽;其他新創公司創辦人和投資者也貢獻了獎金。「這有點像矽谷的聲望,」今年夏天在 SpaceX 實習的法裡託說。
從這裡開始,機器學習模型應該繼續進一步改進並揭示更多字母,直到理想情況下,研究人員能夠破解所有赫庫蘭尼姆古卷。這些努力可能為赫庫蘭尼姆未來的挖掘工作鋪路,一些專家認為那裡仍然埋藏著更多的古卷。
「有些人可能會想,『你費那麼多心思幹什麼?』 但我不相信這一點,」西爾斯說。「這是人類歷史上一個了不起的時期。我們正在談論那個時期的更多作品。是的,我想要更多,我想要這一切。」