「繁中版 LLM 上線」!優必達和臺大為何要做台灣版 ChatGPT?

【民眾網編輯孫敬 Archer/綜合報導】

「臺灣需要一個本土、本地化的 GPT,這對臺灣的歷史和文化發展來說,將會有很大的影響力」雲端串流服務公司優必達(Ubitus)執行長郭榮昌指出,優必達已和臺灣大學資訊工程學系副教授陳縕儂,共同推出「臺版大型語言模型(Taiwan LLM)」,現已開源免費使用,可支援繁體中文、英文、日文三種,年底更有望加入第四種韓文,未來將擴大在遊戲、醫療、法律、製造業等場景應用。

優必達和臺大資工系在 Taiwan LLM 開發上合作許久。Photo Credit:孫敬攝影
優必達和臺大資工系在 Taiwan LLM 開發上合作許久。Photo Credit:孫敬攝影

優必達「Taiwan LLM」囊括臺灣 300 億個繁體中文字資料庫

標榜臺灣繁中語系大型語言模型的 Taiwan LLM,是以 Meta Llama 2 技術為基礎,結合 AWS(Amazone Web Service)雲端算能開發出的「臺灣版 LLM」,其主要資料庫來源為百科、新聞、小說、雜誌和社群討論內容,總計 300 億個繁中文字資料庫,對開發大型語言模型來說,母語非英文體系的使用者能獲得更精準的答案。

Taiwan LLM 最新 2.0 版本,現在已經上架開源社群 GitHub 供開發者自由下載,開發者可根據自身需求對模型微調,自訂提示詞和應用情境,讓 AI 回覆的內容在滿足專業度之餘,更貼近使用者日常生活情境。

去年 OpenAI 推出 ChatGPT 至今,許多國家也相繼投入開發自家 LLM,為何臺灣也要有一個自己的「繁體中文版」?陳縕儂以自身實測經驗回應,當我們和 ChatGPT 詢問「NTU」時,AI 給我們的回應卻是南洋理工大學(Nanyang Technological University),而不是台灣大學(NTU),這顯現出 ChatGPT 難根據各國家地方語言及文化,給出符合使用者的回覆,這也促成優必達跟陳縕儂一同開發出 Taiwan LLM 的原因之一。

基於 Taiwan LLM 架構下,已開發出 4 項不同的 AI 延伸工具

優必達資深商業開發經理許朝欽分享,優必達已根據 Taiwan LLM 開發出的 4 項產品「臺灣版 ChatGPT:Ubi GPT」、「虛擬網紅:Ubi-chan 優必醬」、「圖片生成 AI:Ubi Art」以及「虛擬主播 Ubi Anchor」。

Ubi GPT:台灣版繁中語系的 ChatGPT

優必達現開放 API 串聯經過微調後的 LLM 資料,在發佈會的 Demo 展示中,優必達分享了透過 Ubi GPT整合到 Unreal 遊戲引擎,搭配優必達雲端串流服務所製作的 AI NPC 應用範例,可以在平板、電腦等各種裝置上體驗跟遊戲世界的 AI NPC 以自然語言講話互動的情境。

Ubi Han 可支援流暢的繁體中文互動。Photo Credit:孫敬攝影
Ubi Han 可支援流暢的繁體中文互動。Photo Credit:孫敬攝影

Ubi-chan 優必醬:優必達原創虛擬網紅

以 Ubi GPT 為底層基礎,結合 Taiwan LLM 語言分析後能在互動過程中,輕易創造出喜怒哀樂等不同的表情與肢體變化,甚至可以邀請她跳舞、拍照合影或當場繪畫創作。

Ubi-chan 優必醬可根據指令做出不同的回應與動作。Photo Credit:孫敬攝影
Ubi-chan 優必醬可根據指令做出不同的回應與動作。Photo Credit:孫敬攝影

Ubi Art:融合 Stable Diffusion 的圖片生成 AI

整合了 Stable Diffusion 和 Taiwan LLM 開發出的新產品,使用者能輕易地操作,並從文生圖、圖生圖、角色姿勢定義、影像去背,到一鍵生成動畫。

Ubi Art 不需要繁雜的提示詞,每次可生成 4 張圖片。Photo Credit:孫敬攝影
Ubi Art 不需要繁雜的提示詞,每次可生成 4 張圖片。Photo Credit:孫敬攝影

Ubi Anchor:優必達虛擬主播 

透過 Taiwan LLM 分析後,可從 2、3千字的新聞稿快速濃縮摘要主播用文稿,利用 TTS 語音模型生成專屬聲音,再利用 AI 繪圖模型來生成主播的嘴型,最終達到自動化的影音生成,打造全年無休的AI主播。

Ubi Anchor 現已融入 AI 主播來擘報新聞。Photo Credit:孫敬攝影
Ubi Anchor 現已融入 AI 主播來擘報新聞。Photo Credit:孫敬攝影

「這不只是 Taiwan LLM 的啟用,更是集結產官學力量、一起開啟一個『繁中大訓練的時代』,台灣繁體中文語言模型正式開始建置的啟動,優必達會持續投入算力,拋磚引玉讓更多科技人才與優秀的繁中文化資產能一起投入,幫助 Taiwan LLM 不斷地開源回饋給社會,為台灣繁中文化保留與 AI 科技的整合,貢獻一份心力。」郭榮昌談到。