DeepSeek改變其它AI廠投資方向?曲博預測:美國可能減少硬體投資成本
AI市場正打得火熱,DeepSeek的出現更引發歐美市場大為震撼。知識力執行長曲建仲(曲博)今(14)日在節目《論政天下》中表示,目前人工智慧模型仍屬於「通用人工智慧」,未來的國際趨勢將會專精小模型,讓特定功能的精確度有效提升,他也預估,未來人工智慧的模型,將會進入百家爭鳴的時代。
曲建仲表示,目前市面上的AI軟體,有DeepSeek、ChatGPT-4o、Google Gemini等,其中DeepSeek最大特色是開源的模型,全球都免費使用,外界分析發現它的模型小於另外兩款人工智慧,推測當初DeepSeek所用成本應該比較低。
曲建仲表示,DeepSeek訓練資料多是中文數據,因此在中文創作如詩詞歌賦,會略勝一籌,至於一般資料分析、生成圖片或寫程式,DeepSeek相較其餘兩種相較不成熟。談及訓練語言模型開發的流程,曲建仲說明,共分成3階段:預訓練、微調、自然語言處理應用。第1階段的預訓練,會將許多沒有提供資訊的語料數據,輸入給電腦,要求模型自行分類,這個階段出來的參數,精確度不高,接下來會進入第2階段微調,之後會給模型少數有標註的語料數據,然後就會得到特定領域的模型,使用者就可以藉此進行資料推論。
開源模型才是未來?曲建仲:將讓更多廠商加入AI領域
曲建仲表示,許多人質疑為何要將模型開源,但目前Facebook的Meta也是開源的。模型開源最主要的目的,就是希望更多人使用,未來將會獲得更多話語權,以前許多廠商會想拿別人寫好的模型直接使用,他們就會選擇Facebook的模型,但現在可能就會選擇DeepSeek,因此開源對於人工智慧的發展是正面的,將讓更多廠商加入這個領域,利用已開發的模型,創造更多不同的應用商品。
針對大模型跟小模型的差異,曲建仲表示,使用大模型是希望可以在大模型上做所有的應用,專業術語稱為「通用人工智慧」,如同人類的大腦一樣,可以擅長多種技能,但目前的科技還難以達成一個模型樣樣精通,未來仍適合以小模型針對特定應用為主,讓精確度可以提升。過去歐美國家資源豐富,有較多資金可以投資AI硬體,會使用暴力破解法訓練AI,中國過去也因為封鎖國外軟體,以及新創公司沒有擁有較多資源,則從軟體開始著手,利用改善演算法,降低運算的複雜度。
曲建仲表示,外界猜測中國用了資料蒸餾的技術,減少運算需求,因此美國明年的業界廠商可能會開始思考,有沒有辦法改善軟體,同時減少硬體的投資成本,這也將會導致未來AI硬體需求減少。
更多風傳媒報導