AI在最新「能力測試」中展現突破進展，大幅超越人類

高詩豪

2024年5月3日上午5:00

在科技飛速發展的風暴中，人工智能（AI）不僅追趕上人類的能力，而且正在以驚人的速度前進，重新定義機器可以做什麼的標準。根據斯坦福大學人本中心人工智能研究所最新發布的AI指數報告，AI在眾多關鍵性能領域已經超越了人類，而且進步的速度只會加快。

讓我們回顧一下2015年AI首次在圖像分類上超越人類的時刻。快進到今天，AI系統已經掌握了從「閱讀理解」到「視覺推理」和「自然語言推理」的任務。這些迅速的進步使研究人員不得不急忙尋找新的基準，因為舊的基準不再用來測試AI的極限，而是突出人類仍然保持優勢的地方。

在這些發展中，AI仍然顯示出一些掙扎，特別是在複雜的認知任務，如高級數學問題解決方面。然而，進展是不可否認的。例如，2021年，AI只解決了不到7％的高級數學問題；到了2023年，這一數字跳升至84.3％——接近人類的基線90％。

數學推理能力增加但幻覺仍是問題

視覺常識推理（VCR）是AI取得重大進展的另一個領域。通過理解情境並預測視覺場景中的結果，AI在VCR的熟練度在過去一年中大幅提高，使其更接近人類水平。

然而，並非一帆風順。AI「幻覺」現象，即系統生成誤導性或虛假信息，仍然是一個挑戰。這一點在去年尤為突出，當時一名律師因提交AI生成的但事實不正確的法律文件而面臨重罰。

另一方面，AI生成圖像的進步無疑是革命性的。像DALL-E 2和Midjourney這樣的模型正在生產的圖像與它們的文本描述越來越一致，展示了在美學、質量和創新性方面的改進。

展望未來，2024年預計將帶來更多突破性的AI發展，GPT-5的即將推出可能會重新定義AI能力的格局。

AI的這種快速演進不僅展示了其增強我們生活的潛力，還強調了在部署過程中保持警覺的必要性，確保安全、可信性和倫理考慮始終處於前沿。

請繼續關注我們【明日科學】，我們將繼續探討AI帶來的變革性影響，接下來我們將深入了解這一不可阻擋的技術力量，所帶來的社會影響和挑戰。

更多科學與科技新聞都可以直接上明日科學網 http://www.tomorrowsci.com

首圖來源：DALL.E

圖片來源：Midjourney/AI Index 2024 cc By4.0

參考出處：
1.AI Index: State of AI in 13 ChartsStanford University