GPT太燒錢!微軟暗地準備「B計畫」、打造更實惠AI模型,想抽身OpenAI了

GPT技術龐大的運算成本,可能連微軟也吃不消了。儘管微軟與OpenAI間的合作看似越發緊密,現在卻傳出暗地裡正在悄悄準備著「B計畫」,想開發更實惠的AI模型,以節省GPT技術昂貴的營運成本。

根據《The Information》報導,有消息人士透露,率領微軟1,500名科學家的研究主管Peter Lee,正在動員部分人力開發低成本的聊天機器人,並試圖將這項技術整合到既有的微軟產品當中。

雖然這些微軟自研的聊天機器人技術、參數規模都比不上OpenAI的產品,但營運成本更低、速度更快。目前微軟正在積極擴大AI技術的使用範疇,從放上瀏覽器供人免費使用的Bing Chat,到結合旗下生產力工具的Copilot,用戶數量可能超過10億人,倘若均使用OpenAI等級的技術,恐怕要營利會更為困難。

GPT技術營運成本太高,就像「叫博士去接電話」

營運ChatGPT的成本之高,一直以來都是OpenAI將技術商業化的最大難題之一。半導體研究機構SemiAnalysis首席分析師迪倫.帕特爾(Dylan Patel)曾表示,ChatGPT的營運成本預計每天高達70萬美元,倘若是性能更高的GPT-4運行成本會再高上許多。

帕特爾指出,ChatGPT等大型語言模型的訓練成本固然高昂,但營運成本才是最沉重的負擔,可說正常部署的情況下,營運成本都會遠遠超過訓練成本。

延伸閱讀:ChatGPT之父來台灣:現在是最幸運的時代!AI未來能多厲害?他一次解答

值得一提的是,微軟早已經默默減少對GPT技術的依賴。例如Bing Chat具有平衡、創意及精確三種模式,平衡模式使用的就是自家的普羅米修斯模型(Prometheus model),並由圖靈語言模型(Turing language model)支援,主要負責相對簡單的問題,創意及精準模式才由GPT-4處理。

Bing 圖/Bing
Bing 圖/Bing

微軟以超越競爭對手的速度將AI服務商業化,或許也是與OpenAI技術的昂貴成本有關。Bing Chat已經推出商用版,並且考慮導入廣告;Copilot更已經以每月30美元的價格正式上線,這個價格相比Microsoft 365最貴的方案,都是超過50%的增幅。

企業軟體公司Databricks高層納文.拉奧(Naveen Rao)指出,微軟開始追求更經濟的AI模型是「必然會發生的」,「微軟是一間很精明的公司,他們很追求效率,推出產品使用如GPT-4般的龐大模型,就好像叫三個博士當接線生,這在經濟上行不通。」

今年7月微軟與Meta在大型語言模型Llama 2上進行合作,現在看來或許也是降低對OpenAI技術依賴的一次嘗試。

用GPT-4生產資料訓練,微軟靠高品質材料打造高CP AI模型

事實上,《The Information》提到,微軟團隊也沒有幻想能用少少資源打造如GPT-4一般強大的AI技術,這個團隊沒有同等的運算資源、也沒有大量人力提供大型語言模型回饋以協助工程師改善,而且微軟多數時間都花在調整OpenAI的產品上,撇除OpenAI的情況下,亞馬遜、Google等競爭對手都在大型語言模型研發上投入更多。

微軟對更經濟實惠AI技術的追求,或許可從動用的資源中看出,為了開發更經濟實惠的AI技術,Peter Lee決定動用2,000顆輝達(Nvidia)的GPU打造新模型──這個數字遠遠低於輝達供應給OpenAI逾2萬顆的數量。

儘管在AI方面的資源不多,與OpenAI的合作替微軟帶來了「取巧」的機會。今年6月微軟開發了AI模型Orca,藉由將GPT-4生成的數百萬個答案輸入到開源模型中,教導它模仿GPT-4,進而實現超越其餘開源模型的成果,並且在部分層面足以媲美免費版的ChatGPT。

GPT-4 圖/shutterstock
GPT-4 圖/shutterstock

微軟近期推出的Phi-1,這個有著13億參數的模型同樣是利用GPT-4產生的「教科書級」資料訓練,因此能夠在測試中擊敗使用100多倍資料的其他大型模型,只有GPT-4在同樣的測試中表現更優異。這些例子顯示,GPT-4產生的高品質訓練材料,讓微軟能夠用更小的力氣打造高性能的AI模型。

隨著自研模型初獲成果,微軟也在考慮如何在Bing Chat更大幅度導入Orca、Phi等模型,進一步降低GPT模型的使用。

在微軟一步步降低對OpenAI依賴的同時,兩家公司的關係也隨著商業化腳步變得微妙。OpenAI發表ChatGPT Enterprise時,就被外界詢問是否會與企業Bing Chat競爭;而微軟基於Azure的Private ChatGPT服務,曾經的宣傳標語就是比ChatGPT更安全。

延伸閱讀:ChatGPT可以上網了!還能說話、看圖片、翻譯podcast,重磅更新一次看

資料來源:The InformationThe DecoderBusiness Insider

責任編輯:林美欣

更多報導
Meta搶進AI圖片生成領域,新模型Emu助攻!1.7萬元Quest 3也搶先蘋果亮相
LLM是什麼?跟AI的關聯為何?大型語言模型要面對什麼挑戰?一文看懂