【台灣AI大戰略3】讓通才變專才 工研院發展微型化私有雲解決洩密疑慮

工研院認為,比起深耕大型語言模型的市場,台灣更應聚焦小模型投入,在其中找到發展的利基點。(工研院提供)
工研院認為,比起深耕大型語言模型的市場,台灣更應聚焦小模型投入,在其中找到發展的利基點。(工研院提供)

生成式AI遍地開花,隨著越來越多人將資訊、問題投進大型語言模型ChatGPT,希望從中得到想要的解答,過程中恐怕也無意間透露了個人資料,隱私洩密風險隨之墊高。在此趨勢下,工研院建議發展微型化私有雲技術,解決洩密問題。

「我們只能跟大型巨量語言模型ChatGPT合作、互動嗎?」工研院資通所暨服科中心技術長郭景明提出這個疑問。接著他給予否定答案,並肯定地說道,我們可以做更多事情,包含在語言模型上掌握新的技術,或擬訂策略進行下一步。

對於生成式AI布署可能方向,郭景明表示,眾所皆知,ChatGPT可以幫助人們實現很多事情,但在某些單項任務效果卻無法比現有技術更好,例如翻譯、摘要、編輯等,此時只要在上面加Adapter(可以想像淺層神經網路植入小模型),就有機會做到翻譯上當代最好的效能,這是基礎於大模型上,可以有更多著墨的方向。

另一方面,郭景明則直指小語言模型的發展機會。他說道,近期有越來越多ChatGPT竟然變成政府、企業洩密管道的新聞,為此,在今年3月史丹佛(Stanford)大學和柏克萊(UC Berkeley)兩所大學研究團隊不約而同,分別做出約130億個參數量的小型語言模型Alpaca和Vicuna,期望藉此降低資料洩密問題。

在降低資料外洩風險之虞,郭景明分析,Vicuna正確率只比ChatGPT少1%,但模型遠比ChatGPT小非常多。而從成本來看,Vicuna建置僅花幾百元美元,反觀ChatGPT或其他大型語言模型,使用的訓練費約動輒數百萬美元。以此來思考,台灣真的僅能使用大型語言模型嗎?答案其實顯而易見。

目前工研院聚焦商務、服務、健康、永續、設計、製造等領域。郭景明強調,要解決洩密問題,勢必要走小型化模型,並建置在私有雲上面,包含法遵、安控、物流運輸相關應用都用上它。值得一題的是,與設計和製造相關,毫無懸念也都是選擇用上小語言模型,如IC輔助式設計、半導體材料生成、新藥生成等。

工研院總營運長暨AI策略長余孝先說道,台灣資源有限,要聚焦有效果的領域來推動。舉例來說,生成式AI可以自動產生一些編碼(Code)、文件,應用在台灣IC產業能助其一臂之力。由於設計IC工程師數量嚴重不足,故工研院做一些AI工具,協助這些IC設計工程師來寫他們所需要寫的程式,這是很重要方向與案例。


【點擊看完整全文】

更多鏡週刊報導
【台灣AI大戰略1】ChatGPT是一本正經胡說八道? 工研院揭台發展四大關鍵
【台灣AI大戰略2】台灣要有小國大戰略 簡立峰生成式AI適用3領域
【缺電引爆儲能商機1】缺電危機引爆上千億商機 台灣儲能系統供應鏈完整