誰最能從生成式人工智慧中受益?

在這一領域中,價值將在哪裡產生?

神譯局是36氪旗下編譯團隊,關注科技、商業、職場、生活等領域,重點介紹國外的新技術、新觀點、新風向。

編者按:生成式人工智慧正在科技領域掀起一股浪潮。那麼,哪些公司將會從中受益,生成式人工智慧將在哪些領域體現出最高的價值呢?本文來自編譯,希望對您有所啟發。

圖片來源:a16z.com

當下,我們開始看到生成人工智慧技術堆疊出現的早期階段。數以百計的新創業公司正在湧入市場,開發基礎模型,建構人工智慧原生應用程式,並建立基礎設施/工具。

對於許多熱門技術趨勢來說,在市場跟上其腳步之前,就已經被過度炒作了。但伴隨生成式人工智慧熱潮的,是真實市場的真實收益,以及真實公司的真實投入。Stable Diffusion 和 ChatGPT 等模型正在創造使用者增長的歷史記錄,一些應用程式在發佈不到一年的時間裡,就達到了1億美元的年營收。並排比較顯示,人工智慧模型在某些任務上的表現,比人類好幾個數量級。

因此,有足夠的早期資料表明,大規模的轉變正在發生。我們不知道的關鍵問題是:在這個市場中,價值將在哪裡產生?

在過去的一年裡,我們會見了幾十位直接處理生成式人工智慧的初創公司創始人,和大公司的經營者。我們觀察到,到目前為止,基礎設施供應商可能是這個市場上最大的贏家,他們獲得了流經堆疊的大部分資金。應用程式公司的營收增長非常快,但在留存率、產品差異化和毛利率方面卻經常遇到困難。而大多數模型提供商,雖然對這個市場的存在負有責任,但還沒有達到大規模的商業規模。

換句話說,創造最大價值的公司(即訓練生成式人工智慧模型,並將其應用於新應用程式的公司),並沒有獲得大部分價值。預測接下來會發生什麼要難得多。但我們認為,關鍵是要理解堆疊的哪些部分是真正的差異化和可防禦的。這將對市場結構和長期價值的驅動因素(如利潤率和留存率)產生重大影響。到目前為止,除了傳統的護城河之外,我們很難在堆疊的其他地方,找到結構性的防禦能力。

我們非常看好生成式人工智慧,並相信它將對軟體行業及其他行業產生巨大影響。這篇文章的目標是描繪出市場的動態,並開始回答關於生成式人工智慧商業模式的更廣泛問題。

1. 高級技術堆疊:基礎設施、模型和應用程式

為了理解生成式人工智慧市場是如何形成的,我們首先需要定義當前的堆疊是如何形成的。以下是我們的初步觀點。

堆疊可以分為三層:Applications 層,Models 層和 Infrastructure 層。圖片來源:a16z.com

堆疊可以分為三層:

  • Applications 層:將生成式 AI 模型整合到“面向使用者的產品”中的應用程式,要麼運行自己的模型管道(“端到端應用程式”),要麼依賴於第三方 API。

  • Models 層:驅動 AI 產品的模型,以專有 API 或開源檢查點的形式提供(這又需要一個託管解決方案)。

  • Infrastructure 層:為生成式人工智慧模型運行訓練和提供推理工作負載的基礎設施供應商(即雲平台和硬體製造商)。

需要注意的是:這不是一個市場地圖,而是一個分析市場的框架。在每個類別中,我們都列出了一些知名供應商。我們沒有試圖做到全面,或列出所有已經發佈的生成式 AI 應用程式。我們在這裡也不會深入討論 MLops 或 LLMops 工具,這一點將在未來的文章中討論。

2. 第一波生成式 AI 應用已經開始達到規模,但在留存率和差異化方面卻存在困難

圖片來源:a16z.com

在之前的技術週期中,傳統的觀點是,要建立一個獨立的大型公司,你必須擁有終端客戶,無論這意味著個人消費者還是 B2B 買家。人們很容易相信,生成式人工智慧領域最大的公司也將是終端使用者應用程式。到目前為止,情況還不清楚。

可以肯定的是,生成式 AI 應用程式的增長是驚人的,這是由純粹的新穎性和大量的用例推動的。事實上,我們知道至少有三個產品類別的年化收入已經超過了 1 億美元:圖像生成、文案寫作和程式碼編寫。

然而,僅靠增長還不足以建立持久的軟體公司。至關重要的是,增長必須是有利可圖的,從這個意義上說,使用者和客戶一旦註冊,就應該會產生利潤(高毛利率),並長期留在這裡(高留存率)。在缺乏強大的技術差異化的情況下,B2B 和 B2C 應用程式通過網路效應、保存資料或建構日益複雜的工作流,來推動長期客戶價值。

在生成式 AI 中,這些假設並不一定成立。在與我們交談過的應用公司中,毛利率的範圍很廣,雖然在少數情況下高達 90%,但更多情況下是低至 50%-60%,這主要是由模型訓練的成本驅動的。漏斗頂部的增長非常驚人,但目前還不清楚客戶獲取策略是否具有可擴展性,而且我們已經看到付費獲取效率和留存率開始下降了。許多應用程式也相對無差別,因為它們依賴於相似的底層人工智慧模型,沒有創造出競爭對手難以複製的明顯網路效應或資料/工作流。

因此,目前還不清楚銷售終端使用者應用程式是否是建構可持續生成式人工智慧業務的唯一途徑,或者是最佳途徑。隨著語言模型的競爭和效率的提高,利潤率應該會提高(下文將詳細介紹)。隨著人工智慧遊客離開市場,留存率應該會增加。有一個強有力的論點是,垂直整合的應用程式在推動差異化方面具有優勢。但還是有很多東西需要證明。

展望未來,生成式 AI 應用公司面臨的一些重大問題包括:

  • 垂直整合(“模型+App”)。將 AI 模型作為一種服務消費,允許應用程式開發人員在小團隊中快速迭代,並隨著技術的進步交換模型提供商。另一方面,一些開發者認為產品就是模型,從頭開始的訓練是建立防禦能力的唯一方法,即不斷地對專有產品資料進行再訓練。但這是以更高的資本要求和更不靈活的產品團隊為代價的。

  • 建構功能 vs.應用程式。生成式人工智慧產品有許多不同的形式:桌面應用程式、移動應用程式、Figma/Photoshop 外掛、Chrome 擴展,甚至是 Discord 機器人。在使用者已經使用的東西上整合 AI 產品很容易,因為 UI 通常只是一個文字框。這些生成式 AI 公司中哪些將成為獨立的公司,哪些將被微軟或Google等已經將人工智慧納入其產品線的現有公司所吸收?

  • 穿越炒作週期。目前還不清楚當前這批生成式人工智慧產品的流失是固有的,還是早期市場的人為產物。或者,對生成式人工智慧的興趣是否會隨著炒作的消退而下降。這些問題對應用程式公司具有重要意義,包括何時加速融資;如何積極投資獲取客戶;優先考慮哪些使用者群體;以及何時宣佈產品與市場的契合。

3. 模型提供商發明了生成式人工智慧,但還沒有達到很大的商業規模

圖片來源:a16z.com

如果沒有Google、OpenAI 和 Stability 等公司出色的研究和工程工作,我們現在所說的生成式人工智慧就不會存在。然而,與使用量和熱度相比,與這些公司相關的收入仍然相對較小。在圖像生成方面,Stable Diffusion 公司已經看到了社區的爆炸性增長。但作為他們業務的核心原則,Stable Diffusion 公司免費提供主要檢查點。在自然語言模型中,OpenAI 以 GPT-3/3.5 和 ChatGPT 佔主導地位。但到目前為止,基於 OpenAI 建構的殺手級應用相對較少,而且價格已經下降過一次了。

這可能只是一個暫時的現象。Stability 是一家尚未專注於盈利的新公司。OpenAI 有潛力成為一項巨大的業務,隨著更多殺手級應用程式的建立,尤其是如果能順利整合到微軟的產品組合中,它將在所有 NLP 類別的收入中獲得很大一部分。鑑於這些模型的巨大使用量,大規模的收入可能也不遠了。

圖片來源:a16z.com

但也有與之抗衡的力量。作為開源發佈的模型可以由任何人託管,包括不承擔與大規模模型訓練相關的成本(高達數千萬或數億美元)的外部公司。目前還不清楚是否有任何閉源模型可以無限期地保持其優勢。例如,我們開始看到 Anthropic、Coherence 和 Character.ai 等公司,在類似的資料集和類似的模型架構上訓練出來的大型語言模型,性能更接近 OpenAI 的水平了。Stable Diffusion 的例子表明,如果開源模型達到了足夠的性能水平和社區支援,那麼專有的替代方案可能會很難與之競爭。

到目前為止,對模型提供商來說,最明顯的結論可能是商業化可能與託管繫結在一起。對專有 API(如 OpenAI)的需求正在迅速增長。開源模型的託管服務(如 Hugging Face 和 Replicate)正在成為方便共享和整合模型的有用樞紐,甚至在模型生產者和消費者之間產生了一些間接的網路效應。還有一個強有力的假設是,可以通過微調和與企業客戶達成託管協議來盈利。

不過,除此之外,模型提供商還面臨著許多重大問題:

  • 商品化。人們普遍認為,隨著時間的推移,人工智慧模型的性能將趨於一致。通過與應用開發者的交談,我們可以清楚地看到,這種情況還沒有發生,在文字和圖像模型中都有強大的領導者。它們的優勢不是基於獨特的模型架構,而是基於高資本要求、專有產品互動資料和稀缺的人工智慧人才。這將成為一個持久的優勢嗎?

  • 棄用的風險。依靠模型提供商是應用程式公司起步的好方法,甚至是發展業務的好方法。但一旦達到足夠大的規模,他們就有動力建立和/或託管自己的模型了。許多模型提供商的客戶分佈高度傾斜,少數應用程式代表了大部分收入。當這些客戶轉向內部 AI 開發時會發生什麼?

  • 錢重要嗎?生成式人工智慧的前景是如此之大(也可能是有害的),以至於許多模型提供商已經組織為公益公司(B corps),發行有上限利潤的股份,或以其他方式明確地將公共利益納入其使命。這絲毫沒有妨礙他們的籌款工作。但是,關於大多數模型提供者是否真的想要獲取價值,以及他們是否應該這樣做,還有待討論。

4. 基礎設施供應商觸及一切,並能從中獲得回報

圖片來源:a16z.com

幾乎所有的生成式人工智慧都要經過雲託管的 GPU(或 TPU)。無論是對於運行訓練工作的模型提供商/研究實驗室,運行推理/微調工作的託管公司,還是進行兩者結合的應用程式公司,FLOPS 都是生成式人工智慧的命脈。很長一段時間以來,最具有顛覆性的計算技術的進展第一次大規模地受到計算的約束。

因此,生成式人工智慧市場的大量資金最終都流向了基礎設施公司。我們估計,平均而言,應用程式公司在推理和微調上會大約花費收入的 20-40%。這通常是直接支付給雲端運算實例提供商或第三方模型提供商的,反過來,他們又將大約一半的收入用於雲基礎設施。因此,我們有理由猜測,如今生成式人工智慧總營收的 10-20% 將流向雲提供商。

除此之外,訓練自己模型的初創公司已經籌集了數十億美元的風險資本,其中大部分(在早期高達 80-90%)通常也花在了雲提供商身上。許多上市科技公司每年在模型訓練上花費數億美元,要麼與外部雲提供商合作,要麼直接與硬體製造商合作。

用專業術語來說,這就是我們所說的“a lot of money”(一大筆錢),尤其是對於一個新興市場而言。大部分錢都花在了三大雲服務上:亞馬遜網路服務(AWS)、Google雲平台(GCP)和微軟 Azure。這些雲提供商每年總共花費超過 1000 億美元的資本支出,以確保他們擁有最全面、最可靠、最具成本競爭力的平台。特別是在生成式 AI 領域,它們還受益於供應限制,因為它們可以優先獲得稀缺的硬體(例如 Nvidia A100 和 H100 gpu)。

但有趣的是,我們看到競爭開始出現了。甲骨文(Oracle)等挑戰者已經通過巨額資本支出和銷售激勵措施進入市場。一些創業公司,如 Coreweave 和 Lambda Labs 也發展迅速,提供了專門針對大型模型的解決方案。這些公司在成本、可用性和個性化支援方面展開競爭。

在幕後,運行絕大多數人工智慧工作負載的,可能是迄今為止生成式人工智慧領域最大的贏家:輝達(Nvidia)。該公司報告稱,在其 2023 財年第三季度,資料中心 GPU 收入為 38 億美元,其中相當一部分用於生成式人工智慧用例。通過數十年對 GPU 架構的投資、強大的軟體生態系統以及學術界的深入使用,他們已經圍繞這一業務建立了堅固的護城河。最近的一項分析發現,研究論文中引用輝達 GPU 的次數是頂級 AI 晶片初創公司總和的 90 倍。

其他硬體選項確實存在,包括Google張量處理單元(TPU);AMD Instinct GPU;AWS Inferentia 和 Trainium晶片;以及來自 Cerebras、Sambanova 和 Graphcore 等初創公司的人工智慧加速器。後來者英特爾(Intel)也帶著高端的 Hhavana 晶片和 Ponte Vecchio GPU 進入了這個市場。但到目前為止,這些新晶片很少能佔據可觀的市場份額。不過,有兩個例外值得關注,一個是Google,它的 TPU 已經在 Stable Diffusion 社區和一些大型 GCP 交易中獲得了吸引力,另一個是台積電,據信它生產了這裡列出的所有晶片,包括 Nvidia 的 GPU(英特爾讓自己的晶圓廠和台積電混合製造其晶片)。

換句話說,基礎設施是一種有利可圖的、持久的、具有防禦性的堆疊層。基礎設施公司需要回答的大問題包括:

  • 保持無狀態負載。無論你在哪裡租用 Nvidia 的 GPU 都是一樣的。大多數 AI 工作負載是無狀態的,從某種意義上說,模型推理不需要附加資料庫或儲存(除了模型權重本身)。這意味著 AI 工作負載可能比傳統應用程式工作負載更易於跨雲移植。在這種情況下,雲供應商該如何創造粘性,防止客戶轉向最便宜的選擇?

  • 倖免於晶片短缺的終結。雲供應商和 Nvidia 本身的定價,一直是由最理想的 GPU 供應稀缺所支撐的。一家供應商告訴我們,A100 的標價自推出以來實際上有所上漲,這對計算硬體來說是極不尋常的。當這種供應限制最終通過增加生產和/或採用新的硬體平台而消除時,這將對雲提供商產生什麼影響?

  • 挑戰者的雲技術能實現突破嗎?我們堅信,垂直雲將通過提供更專業的服務,從三巨頭手中奪取市場份額。到目前為止,在人工智慧領域,挑戰者通過適度的技術差異化和 Nvidia 的支援,已經獲得了一定的吸引力。對 Nvidia 來說,現有的雲提供商既是最大的客戶,也是新興的競爭對手。長期的問題是,這是否足以克服三巨頭的規模優勢?

5. 那麼……價值將在哪裡產生?

當然,我們還不知道。但根據我們對生成式 AI 早期資料的理解,結合我們與早期 AI/ML 公司接觸的經驗,我們的直覺如下。

如今,生成式人工智慧領域似乎不存在任何系統性的護城河。應用程式由於使用相似的模型,缺乏強大的產品差異化。由於模型是在具有相似架構的相似資料集上訓練的,因此面臨不明確的長期差異化;雲供應商缺乏深度的技術差異,因為它們運行相同的 GPU;甚至硬體公司也在同一家晶圓廠生產晶片。

當然,也有標準的護城河:規模護城河(“我已經或能夠籌集到比你更多的資金!”)、供應鏈護城河(“我有 GPU,你沒有!”)、生態系統護城河(“大家都已經在使用我的軟體了!”)、演算法護城河(“我們比你更聰明!”)、分銷護城河(“我已經有一個銷售團隊了,而且比你有更多的客戶!”)和資料管道護城河(“我‘爬’過的網際網路比你多!”)。但這些護城河都不可能長期持久。現在判斷強大、直接的網路效應是否會在堆疊的哪層佔據上風還為時過早。

根據現有的資料,目前還不清楚生成式人工智慧是否會長期出現“贏家通吃”的動態。

這很奇怪。但對我們來說,這是個好消息。這個市場的潛在規模很難把握,所以我們預計會有很多很多的參與者,在各個層上都有健康的競爭。我們也希望橫向和縱向公司都能取得成功,因為最終市場和終端使用者決定了最佳的方法。例如,如果最終產品的主要區別是人工智慧本身,那麼垂直化可能會勝出。然而,如果人工智慧是一個更大的長尾功能集的一部分,那麼就更有可能發生橫向化。當然,隨著時間的推移,我們也應該看到更多傳統護城河的建立,甚至可能會看到新型護城河佔據上風。

無論如何,我們可以肯定的是,生成式 AI 改變了遊戲規則。我們都在即時學習這些遊戲規則,有大量的價值將被釋放,科技領域將因此變得非常非常不同。而我們正為此而努力!

這篇文章中的所有圖片都是使用 Midjourney 生成的。

譯者:Jane

本文經授權發布,不代表36氪立場。

如若轉載請註明出處。來源出處:36氪