【阮嗣宗專欄】AI迫使我們思考科學是什麼
大語言模型可以做從閱讀文獻到撰寫和審查自己的論文的所有事情,但到目前為止它的適用範圍有限。達維德‧卡斯泰爾維奇 Davide Castelvecchi發表在最新一期《自然》(Nature)的<研究人員打造了一位「人工智慧科學家」——它能做什麼?>( Researchers built an ‘AI Scientist’ — what can it do?)說,科學可以完全自動化嗎?一組機器學習研究人員現已進行嘗試。
它們可能有幫助科學的潛力
「AI 科學家」由東京 Sakana AI 公司的團隊以及加拿大和英國的學術實驗室創建,執行從閱讀有關問題的現有文獻、為新發展提出假設到嘗試解決方案和解決方案的整個研究週期。篇論文。 AI Scientist 甚至承擔同儕審查員的一些工作並評估自己的結果。
人工智慧科學家加入了一系列努力來創建至少部分科學過程自動化的人工智慧代理。 「據我所知,還沒有人在一個系統中完成整個科學界的工作,」AI Scientist 的聯合創始人、加拿大溫哥華不列顛哥倫比亞大學的機器學習研究員 Cong Lu 說。結果已於本月發佈在 arXiv 預印本伺服器上。
「令人印象深刻的是,他們端對端地完成了這項工作,」西雅圖華盛頓大學的計算社會科學家傑文·韋斯特 (Jevin West) 說。 “我認為我們應該嘗試這些想法,因為它們可能有幫助科學的潛力。”
人工智慧進行實驗室工作的能力
目前輸出還不算驚天動地,系統只能做機器學習本身領域的研究。特別是,人工智慧科學家缺乏大多數科學家認為從事科學研究的關鍵部分——進行實驗室工作的能力。勞倫斯伯克利國家實驗室和加州大學柏克萊分校的材料科學家 Gerbrand Ceder 表示:“從人工智慧提出假設到在機器人科學家中實現這一假設,還有很多工作要做。”儘管如此,塞德補充道,“如果你展望未來,我毫不懷疑這就是大部分科學的發展方向。”
AI Scientist 是基於大型語言模型(LLM)。使用描述機器學習演算法的論文作為模板,從搜尋文獻中尋找類似的工作開始。然後,該團隊採用了稱為進化計算的技術,該技術受到達爾文進化論的突變和自然選擇的啟發。它分步驟進行,對演算法進行小的隨機更改,並選擇可提高效率的更改。
科學不僅僅是一堆論文
為此,人工智慧科學家透過運行演算法並測量其性能來進行自己的「實驗」。最後,它產生一篇論文,並以自動同行評審的方式對其進行評估。以這種方式「擴充文獻」後,演算法可以根據自己的結果再次開始循環。
作者承認,人工智慧科學家發表的論文僅包含漸進的發展。其他一些研究人員在社群媒體上發表了嚴厲的評論。 「身為期刊編輯,我可能會直接拒絕他們。作為一名評論者,我會拒絕他們,」駭客新聞網站上的一位評論者說。
韋斯特也表示,作者對研究人員如何了解其領域的現狀採取了簡化的觀點。他們所知道的很多東西都來自其他形式的交流,例如參加會議或在飲水機旁與同事聊天。 「科學不僅僅是一堆論文,」韋斯特說。 “你可以進行 5 分鐘的對話,這比 5 小時的文獻研究要好。”
科學發現自動化的夢想與人工智慧本身一樣古老
West 的同事 Shahan Memon 對此表示同意,但 West 和 Memon 都稱讚作者完全開放了他們的程式碼和結果。這使他們能夠分析人工智慧科學家的結果。例如,他們發現,在選擇列為參考文獻的早期論文時,它存在“受歡迎程度偏差”,會避開那些引用次數較高的論文。梅蒙和韋斯特表示,他們也正在研究衡量人工智慧科學家的選擇是否是最相關的。
當然,AI Scientist 並不是第一次嘗試將研究人員工作的至少各個部分自動化:電腦 Tom Hope 表示,科學發現自動化的夢想與人工智慧本身一樣古老,可以追溯到 20 世紀 50 年代。智能研究所的科學家。例如,十年前,自動統計學家2就能夠分析資料集並撰寫自己的論文。 Ceder 和他的同事甚至實現了一些工作的自動化:他們去年推出的「機器人化學家」可以合成新材料並用它們進行實驗。
AI迫使我們思考二十一世紀的科學是什麼
霍普表示,目前的法學碩士「除了流行語的基本膚淺組合之外,無法制定新穎且有用的科學方向」。儘管如此,Ceder 表示,即使人工智慧無法很快完成工作中更具創意的部分,它仍然可以自動化研究中許多更具重複性的方面。 「在低層次上,你試著分析某物是什麼,某物如何反應。這不是科學的創造性部分,但它是我們所做工作的 90%。盧說,他也從許多其他研究人員那裡得到了類似的回饋。 「人們會說,我有 100 個想法,但我沒有時間。讓人工智慧科學家來做這些事情。
盧表示,為了擴大人工智慧科學家的能力——甚至擴展到機器學習以外的抽象領域,例如純數學——它可能需要包括語言模型以外的其他技術。例如,GoogleDeep Mind 最近解決數學問題的結果顯示了將法學碩士與「符號」人工智慧技術相結合的力量,該技術將邏輯規則構建到系統中,而不僅僅是依賴從數據中的統計模式中學習。但他表示,目前的迭代只是一個開始。 「我們真的相信這是人工智慧科學的 GPT-1,」他說,指的是加州舊金山 OpenAI 的早期大型語言模型。
韋斯特說,這些結果引發了一場爭論,這是目前許多研究人員最關心的問題。 「我所有不同科學領域的同事都在試圖弄清楚,人工智慧在我們的工作中發揮著怎樣的作用?它確實迫使我們思考二十一世紀的科學是什麼——它可能是什麼、它是什麼、它不是什麼,」他說。