微軟 SpreadsheetLLM 問世,AI 更容易解讀試算表資料

試算表在資料管理無所不在,透過微軟 Excel 和 Google 試算表等平台被廣泛使用。微軟研究人員新推出一種 AI 模型「SpreadsheetLLM」,可存取和理解試算表資料,這將是商用 AI 重大進展。

一篇《SpreadsheetLLM: Encoding Spreadsheets for Large Language Models》新論文日前上傳至 arXiv.org,為 AI 模型應用在人們廣泛使用但格式複雜的試算表解決一大難題。

從簡單的資料輸入和分析,再到複雜的財務模型建立和決策判斷,試算表廣泛運用在商業世界,凸顯重要性。「由於資料的結構化性質以及公式和引用的存在,現有語言模型很難理解和推理試算表內容」,研究人員談道。

SpreadsheetLLM 可將大型語言模型的強大功能和試算表的結構化資料結合,「SpreadsheetLLM 是將試算表內容編碼格式變成可與大型語言模型一起使用的新方法,允許模型對試算表內容進行推理」,研究人員指出。

具體而言,SpreadsheetLLM 以大型語言模型可理解和使用的方式,對試算表資料進行編碼以彌補差距。該模型使用一種嶄新的編碼方案,可以保留試算表結構和關係,同時可供模型存取。

SpreadsheetLLM 一大優勢在於能使試算表資料更容易讓模型存取、讓使用者理解。與此同時,SpreadsheetLLM 潛在應用相當廣泛,從自動化常規資料分析,再到對試算表資料提供見解和建議等。當大型語言模型能夠推理試算表內容、回答有關數據的問題,甚至根據自然語言提示生成新的試算表,這讓 SpreadsheetLLM 為商用 AI 輔助數據分析和決策帶來更多可能性。

▲ SpreadsheetLLM 架構。(Source:arXiv.org

微軟去年 3 月發表 AI 助理 Microsoft 365 Copilot,幫助使用者完成各種任務、提升工作效率;今年 2 月進一步推出 Copilot for Finance 公開預覽版,是專為財務方面設計的 Copilot 產品。現在加上 SpreadsheetLLM 研究,這些發展證明微軟致力將 AI 應用的強大力量帶給企業客戶,將改變人們處理、分析資料的方式。

(首圖來源:Microsoft Excel Blog