讓AI更懂臺灣繁體中文 臺灣自主研發TAME模型讓人驚豔

打造臺灣 AI 應用生態系,長春、和碩、長庚、欣興電子、科技報橘五家企業聯合發布繁體中文專家模型 Project TAME
打造臺灣 AI 應用生態系,長春、和碩、長庚、欣興電子、科技報橘五家企業聯合發布繁體中文專家模型 Project TAME

如何讓符合臺灣文化的語言模型,為繁體中文使用者帶來更精準的AI應用?由臺灣業界自主聯合發起,與臺大資工系、臺大資管系及律果科技合作,在 NVIDIA 支持下訓練的「繁體中文專家模型開源專案 TAiwan Mixture of Experts(簡稱 Project TAME )」,今天(1號) 正式發表,是全球首創重量級多產業共同孕育的繁中大型語言專家模型,也是唯一擁有產業專業知識的開源模型,協助臺灣產業快速導入生成式AI落地應用。

 

想像在忙碌的產房中,護理師不僅要協助新生兒接生,之後還要量測各項數據、做成紀錄、輸入電腦,若護理師一邊量測一邊說出數字,AI就能自動判讀並精準生成紀錄,那真是產房的一大助力,而這正是長庚醫院正在為「繁體中文專家模型開源專案(簡稱 Project TAME )」進行訓練的現在進行式。

 

Project TAME 繁中專家模型開源計畫由臺大資工系副教授陳縕儂帶領實驗室同仁與企業夥伴開發團隊共同合作,使用 NVIDIA 開發者計畫技術支持,讓多家垂直產業的企業專家貢獻專業領域的資料,訓練近 5 千億個字(token)開發出繁中大型語言專家模型。包括長春集團、和碩聯合科技、欣興電子、長庚醫院、科技報橘、律果科技等來自石化工業、電子製造、醫療服務、內容服務、法律等各產業代表,成為首批聯合投入 Project TAME 繁體中文模型訓練的業界專家角色。

 

由於TAME使用多家臺灣企業所提供的各領域專業資料進行訓練,參與專案的臺大資工系博士班學生林彥廷指出,這樣模型具有在地化特色,避免模型以美國為主的意識形態、文化觀點來生成。像若詢問語言模型何謂買東西「很盤」,GPT-4o回答「價格合理」,TAME則精準給出「買東西吃了虧」符合臺灣文化的在地答案。而讓幾個模型考臺灣國考、高考及升高中、大學的考試時,總共37個題目,TAME拿到的分數遠高於GPT-4o、Gemini等其他模型。林彥廷也分享,各領域專家提供的資料,讓團隊對AI集中式訓練也將比由各個領域專家分散式訓練,會來得更有效率與效果。

 

繁體中文專家模型 Project TAME 正式對外發布後,將採用 Open Source 開放原始碼的形式,讓各產業企業有一個 Hub 中心可以進行合作。台大資工系副教授陳縕儂指出,在不同的資料間可能有共同交集可以使用, 這對語言模型的發展是更好的,也能讓不同產業的專家貢獻自己領域的資料。目前已開放各企業皆可免費下載使用「繁體中文專家模型 Project TAME」模型聊天頁面、以及由亞太智能機器(APMIC)率先整合 Project TAME,提供聊天機器人測試頁