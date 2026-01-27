為發展主權AI，充實正體中文語料，數發部建置台灣主權AI訓練語料庫。數發部指出，預計今年上半年將與地方政府合作，下半年將進一步攜手民間團體合作，持續充實語料內容。

數發部建置「台灣主權AI訓練語料庫」，並在去年12月上線，由中央機關率先推動，提供具台灣文化特色與觀點的正體中文語料，以支援主權AI模型訓練。數發部資料創新司長莊明芬27日指出，語料庫詞元翻倍成長，內容以文化、教育與歷史等資料較多，語料庫使用申請者多來自學術機構、大學及企業。

莊明芬指出，自語料庫上線後，主要盤點中央機關資料，預計今年第一、第二季起，將與地方政府合作，納入在地文化與歷史數據等資料。數發部也進行跨機關洽談，像是中研院、台灣文學館等機關，期盼釋出更多有價值的語料，她說：『(原音)我們中央機關大概他們已經了解這樣的一個運作機制，也知道怎麼上架了以後。從今年開始第一季跟第二季，我們就會開始朝地方政府來邁進，因為我們其實地方政府也有相當多文化、在地的資料，這些資料也是非常珍貴，我們今年上半年就會開始往地方政府來邁進。』

莊明芬進一步指出，預計將在今年下半年啟動與民間合作，待語料庫建立一定成績後，將舉辦說明會，鼓勵民間企業貢獻資料。

另外，數政司長王誠明說明，自今年起至2030年推動「智慧政府數位化精進發展計畫」，由16個機關、31個計畫組成，預定投入經費約新台幣120億元，透過技術驅動數位轉型，提升政府效能。(編輯：宋皖媛)

