創鑫智慧推生成式AI卡 整合端對端方案省成本

創鑫智慧執行長劉景慈表示,Viper生成式AI卡及整合式的LLM解決方案,可為企業節省成本。(圖/創鑫智慧提供)
創鑫智慧執行長劉景慈表示,Viper生成式AI卡及整合式的LLM解決方案,可為企業節省成本。(圖/創鑫智慧提供)

AI晶片大廠創鑫智慧(Neuchips)在COMPUTEX 2024推出整合RAG(Retrieval-Augmented Generation,檢索增強生成)與LLM(Large Language Model,大型語言模型)的端到端(end-to-end AI)解決方案,執行長劉景慈4日指出,除了透過台積電7奈米製程推出生成式AI卡,創鑫智慧也正在規劃採用5奈米製程的下一代生成式AI晶片。

創鑫智慧致力研發高能效AI ASIC(特殊應用積體電路),推出的整合RAG與LLM的端到端解決方案,可搭配企業內部既有硬體系統即可部署本地端GPT節能加速方案,可顯著降低企業導入LLM的時間與總擁有成本,該解決方案支援多種開源的中文、英文大型語言模型,包含台灣可信任生成式AI模型TAIDE,讓政府等機敏單位能擁有AI賦能優勢。

劉景慈表示,創鑫智慧採用自行研發、台積電7奈米製程製造的ASIC-Raptor生成式AI晶片(原稱N3000),製作成能夠安裝至小型電腦或工作站的Viper生成式AI卡及整合式的LLM解決方案,也就是說,無須額外投入人力、電力、空間等成本,即可結合軟硬體合作夥伴打造企業專屬應用。

企業已認知到將AI導入工作流程對於提升生產力的重要性,但其複雜部署方式與大量先期投入成本,讓企業裹足不前,Viper生成式AI卡使用PCIe介面和電腦連結,擁有半高半寬外型規格體積小巧的優勢,功耗最低僅需35瓦,可直接安裝至既有電腦,或是企業內部負責儲存資料的NAS(Network-Attached Storage,網路附加儲存裝置),進一步強化資料檢索的便利性,更有利於生成式AI發展。

Viper生成式AI卡甚至可支援最多48GB的記憶體空間,可提供企業本地端作為向量資料庫(Vector Database)使用,於單一張生成式AI卡上有效率地完成索取資料、檢索、增強及生成等任務,端對端的運作效率是CPU的10倍以上,加上不須額外連網可離線使用的特色,無須擔心企業敏感資料外洩或是成為資安隱憂。

劉景慈表示,Viper生成式AI卡內建Raptor生成式AI處理器,能夠大幅度卸載生成式AI工作負載對於CPU的負擔,其中嵌入引擎(Embedding Engine)可強化流程中,向量相似度檢索(Vector Similarity Search)的效率及精準度,一體達成檢索增強與生成等工作,強化流程應用與系統效能最佳化,RAG能夠在不重新訓練LLM的前提下,從外部擷取新資訊並整合,節省大量重新訓練AI模型的時間與成本,同時提升推論準確性,並根據企業應用需求進行微調。

更多中時新聞網報導
小資族快看! 「銅板價」黃仁勳概念股 6檔50元以下 這檔還在2字頭
死亡交叉來了「別亂接刀」 老手估台股整理期恐拉長 AI機器人概念股留意這5檔
頂客族遺產想全給配偶 但鬧翻的手足有一半繼承權 專家教戰5招 避免家族爭產