AI在最新「能力測試」中展現突破進展,大幅超越人類

在科技飛速發展的風暴中,人工智能(AI)不僅追趕上人類的能力,而且正在以驚人的速度前進,重新定義機器可以做什麼的標準。根據斯坦福大學人本中心人工智能研究所最新發布的AI指數報告,AI在眾多關鍵性能領域已經超越了人類,而且進步的速度只會加快。

讓我們回顧一下2015年AI首次在圖像分類上超越人類的時刻。快進到今天,AI系統已經掌握了從「閱讀理解」到「視覺推理」和「自然語言推理」的任務。這些迅速的進步使研究人員不得不急忙尋找新的基準,因為舊的基準不再用來測試AI的極限,而是突出人類仍然保持優勢的地方。

在這些發展中,AI仍然顯示出一些掙扎,特別是在複雜的認知任務,如高級數學問題解決方面。然而,進展是不可否認的。例如,2021年,AI只解決了不到7%的高級數學問題;到了2023年,這一數字跳升至84.3%——接近人類的基線90%。

數學推理能力增加 但幻覺仍是問題

如何在Midjourney的逐步版本中改進文本到圖像生成(圖/Midjourney/AI Index 2024)
如何在Midjourney的逐步版本中改進文本到圖像生成(圖/Midjourney/AI Index 2024)

視覺常識推理(VCR)是AI取得重大進展的另一個領域。通過理解情境並預測視覺場景中的結果,AI在VCR的熟練度在過去一年中大幅提高,使其更接近人類水平。

然而,並非一帆風順。AI「幻覺」現象,即系統生成誤導性或虛假信息,仍然是一個挑戰。這一點在去年尤為突出,當時一名律師因提交AI生成的但事實不正確的法律文件而面臨重罰。

另一方面,AI生成圖像的進步無疑是革命性的。像DALL-E 2和Midjourney這樣的模型正在生產的圖像與它們的文本描述越來越一致,展示了在美學、質量和創新性方面的改進。

展望未來,2024年預計將帶來更多突破性的AI發展,GPT-5的即將推出可能會重新定義AI能力的格局。

AI的這種快速演進不僅展示了其增強我們生活的潛力,還強調了在部署過程中保持警覺的必要性,確保安全、可信性和倫理考慮始終處於前沿。

請繼續關注我們【明日科學】,我們將繼續探討AI帶來的變革性影響,接下來我們將深入了解這一不可阻擋的技術力量,所帶來的社會影響和挑戰。

更多科學與科技新聞都可以直接上 明日科學網 http://www.tomorrowsci.com

首圖來源:DALL.E

圖片來源:Midjourney/AI Index 2024 cc By4.0

參考出處:
1.AI Index: State of AI in 13 ChartsStanford University

延伸閱讀:

1.芬蘭咖啡界的AI新浪潮:人工智慧研發出全新咖啡混合豆