Midjourney:AIGC現象級應用,一年實現1000萬使用者和1億美元營收

文生圖賽道是 AIGC 概念下商業模式較成熟的領域,而 Midjourney 是其中最具競爭力的選手,是將 AIGC 技術成功產品化的代表。

Midjourney 創始人堅持AI 不是現實世界的復刻,而是人類想像力的延伸,塑造了充滿科幻色彩的產品定位。因最早開放公眾測試,能通過簡單的 prompt 生成獨具藝術感的圖片而收穫大量使用者。Midjourney 使用者數量飛速增長,並具有很強的盈利能力。其產品搭載在 Discord 上,擁有了超1000 萬社區成員,是目前使用者最多的伺服器,年營收約為1 億美元。

但 AI 技術發展日新月異,如近期出現的 ControlNet,將推動文生圖進一步深入設計工作流;而未來多模態模型的出現勢必會進一步顛覆目前的產品形態。雖通過差異化產品定位擁有了早期資料積累及活躍社區,但作為上層應用,Midjourney 並沒有建立起穩固的護城河,時刻面臨著挑戰。

雖然無法確定該行業的終局,但我們認為 Midjourney憑藉著驚豔的圖片生成效果、活躍的 Discord 社群、通過資料飛輪建立的早期壁壘以及逐步的設計工作流滲透,在一定時間內能夠保持較強的盈利能力;其團隊的快速迭代能力也使其能夠緊跟技術的進步,保持產品的競爭優勢。

以下為本文目錄,建議結合要點進行針對性閱讀。

01 Thesis02 文生圖應用的爆發03 What is Midjourney?04 Who is the Customer?05 Why Midjourney?06 團隊背景07 競爭格局08 收入估算及未來發展

01. Thesis

1. Midjourney 圖片生成效果驚豔,藝術風格在市場上具有差異化優勢。

Midjourney 的 prompt 簡短,具有明顯的科幻性,因圖片精美而具有更強的商業可行性,鎖定基數大、付費意願強的創意設計使用者群,被大量實踐證明能顯著提高工作效率。相比之下,DALL-E2 偏寫實風格,Stable Diffusion 無風格偏向,但需要更長的 prompt 和更多的嘗試才能獲得好的圖片效果。

2. Midjourney 巧妙地通過 Discord 社區搭建產品,具有社區優勢。

社區共創是藝術創作中不可缺少的要素,Discord 的互動形式也是吸引、留存使用者的一大要素。目前 Midjourney 已成為 Discord 使用者最多的伺服器,擁有了超 1000 萬名社區成員。

3. Midjourney 已形成資料飛輪,有利於建立競爭壁壘。Midjourney 最早開放 Openbeta 版本,通過龐大使用者量積累了獨有的資料集,形成資料飛輪,根據使用者需求針對性地訓練模型並快速迭代產品,長期來看更有利於建立競爭壁壘。

4. 目前商業化仍在早期,潛在市場空間巨大。

• 目前採取 SaaS 訂閱制模式,價格為 10 - 60 美元/月。雖未公佈具體付費使用者數量,但根據客戶訪談可知使用者付費意願較強。以目前使用者數量保守估計,年營收能到達約 1 億美元。

• 付費使用者主要為創意設計人群個人愛好者,若對標 Canva 的使用者群,以 Midjourney 目前訂閱價格計算,未來收入能達到約23 億美元

• 技術的不斷迭代會改變目前的產品形態。如 ControlNet 的發佈增強了生成圖片的可控性,進一步深入設計工作流;多模態模型會改變目前的單點產品現狀。未來 Midjourney 計畫開發多功能產品,創造更豐富的應用場景,進一步擴大市場想像空間。

5. Midjourney 團隊技術和產品並重,具有“創業基因”。

創始人 David Holz 為連續創業者,曾是 Leap Motion 創始人之一,團隊成員及顧問擁有 AI 技術及產品創業的復合背景;團隊成員僅 11 人,人效極高。由於技術發展迅速,Midjourney 必須緊跟技術發展,不斷迭代產品。目前來看,Midjourney 團隊在產品研發能力、開發速度方面都有較好的表現。

02. 文生圖應用的爆發

2015 年,Google 研究員 Alexander Mordvintsev 建立了首個用於藝術創作的機器學習應用 DeepDream,這一應用被Google開源,首批藝術家通過演算法生成藝術圖像。從那時起,AI 藝術生成開始走進大眾的視野中。

2021 到 2022 年, 文生圖應用出現了突破性的進展,生成的影像品質得到了迅速提高。2022 年初,用 Disco Diffusion 僅可以生成一些很有氛圍感的草圖;2 個月後,DALL-E2 相比 DALL-E 解析度提高了 400%,已經可以刻畫細節,生成精準的五官;如今,Stable Diffusion 和 Midjourney 創作的圖像更加精緻且具有藝術感,並且將作畫速度縮短到 30s 。

從技術視角來看,這是一場底層模型的飛躍式進步:從 GAN 轉變至 Diffusion 模型。2022 年前,文生圖的模型以生成性對抗網路(GANs)為主。但因為在實踐中存在明顯不足,還不如用 Photoshop 等工具直接創作,無法用於商業化。

Picture generated by GANs

目前文字生成圖像領域的核心方法是 Diffusion 模型,OpenAI 2020 年發佈的 CLIP 使其更為實用。工作原理為通過反覆地向訓練資料新增噪聲來破壞原有資料結構,然後通過“反向擴展”來恢復被破壞的資料。Diffusion 模型互動簡單、生成速度快,極大的降低了使用門檻。伴隨著 Disco Diffusion、Stable Diffusion、DALL-E2、Midjourney 等通用文生圖軟體開放公眾測試,引發了指數級的社交媒體討論及作品展示,成功實現了文生圖應用向 C 端落地。

除了 Midjourney 等通用型文生圖軟體,垂直類應用也層出不窮。不同行業對生成圖片有著不同的要求,需要使用特定資料集訓練,這給垂類賽道的創業企業提供了機會。如專注於 Logo 與網站設計的 looka,專注二次元形象生成的 NovelAI,專注遊戲資產生成的 Scenario,以及專注頭像生成的 Lensa。這些垂類應用目前來看很難成長為大體量公司,但盈利能力強,如 Lensa 在發售後的短短幾週就賺了 4000 - 5000 萬美元。

03. What is Midjourney?

Midjourney 是自籌資金的獨立研究室,目前開發了同名文生圖模型及應用,產品搭載在 Discord 中,使用者通過與 Midjourney bot 進行對話式互動,提交 Prompt(文字提示詞)來快速獲得想要的圖片。

Midjourney bot

Midjourney 採取 SaaS 訂閱制模式。最初使用時,使用者可以免費生成 25 張照片。之後按照訂閱制收費。月付製為 10、30、60 美元,或者使用年付制,價格為 8、24、48 美元/月。值得注意的是,使用者只有在訂閱之後,才能擁有使用 midjourney 創作的圖片的版權。

Midjourney CEO David Holz 曾說過:“人們在紙上繪畫只需要幾秒,但在電腦前卻需要幾分鐘到幾小時;這不是因為電腦不夠智能,也不是因為人們不知道自己想要什麼,而是因為人類和電腦之間存在的某些障礙阻止了我們進行最基本的交換。”Midjourney 想要加強人類與電腦的連接,將 “探索思想的新載體,擴展人類想像力” 作為目標。

Midjourney 在 AI 公司 Value Chain 上佔據了多個位置,擁有資料層、模型層、應用層整個技術堆疊。它參考 CLIP 及 Diffusion 建構了自己的閉源模型,抓取公開資料進行訓練,並建構了 Discord 中的 Midjourney bot 應用。作為應用層公司,Midjourney 收集使用者反饋資料,迭加技術的進步,不斷迭代模型。

AI's next frontier: building and investing in Large Language Models

2022 年 3 月,Midjourney 啟動邀請制 Beta 版本。因為文生圖本身具有極強的吸引力,且 Midjourney 創作的圖片質量很高,所以很快就吸引了大量使用者。

從圖中可以看出,AI 生成藝術的興趣浪潮由 6 月初的 DALL-E2 引發。2022 年 7 月,Midjourney 開放 Openbeta 版本;2022 年 8 月,使用 Midjourney 創作的畫作 Théâtre D’opéra Spatial(太空歌劇院)獲得了美術競賽數字藝術類別的一等獎,人們對於 Midjourney 的關注達到高峰。

雖然文生圖領域應用層出不窮,但 Midjourney 保持住了在人們心目中的地位,目前仍是使用最廣泛、最受使用者喜愛的文生圖應用。截止 2023 年 2 月 12 日,Discord 頻道的使用者數達到1081 萬,早已實現盈利。

04. Who is the customer?

Midjourney 使用者群體廣闊,主要包括創意設計人群、工業設計人群、Web3 & NFT 從業者以及個人愛好者。

創意設計人群

創意設計從業者是一個很大的群體,滲透各行各業。小 b 端,包括產品設計師(如玩具、牆紙等);圖片設計師(網站、廣告、PPT、Logo、插圖等);遊戲設計師(遊戲場景、角色、道具)以及自媒體創作者等等。企業端,Midjourney 可服務廣告公司、影視公司、品牌的廣告創意部門等對於藝術效果圖有大量需求的客戶。

Food Advertising Photography created by Midjourney

RPG Animal Characters created by Midjourney

Midjourney 生成的圖片可以顯著地提高創意設計人群的工作效率。目前 Discord 的使用者中專業設計師佔比達 30% - 40%,包括 Nike、Adidas、New Balance 等公司的設計師。根據客戶訪談,Midjourney 主要被應用於設計工作早期,幫助設計師激發靈感,快速測試想法,並迭代圖片。使用者表示,設計品牌始終在尋找設計新方法和新工具以提高工作效率,對於 Midjourney 的付費意願非常強。Midjourney 的風格包括很多科幻元素,擅長創造環境圖,同時針對人像做了最佳化,風格較為細膩,非常適合遊戲、電影、音樂和出版等創意行業。

工業設計行業

Midjourney 也進入了工業設計等精細化要求較高的領域,如建築設計。目前 Instagram 上有許多建築師分享文生圖作品,有超過 72,000 個帖子被標記為 #midjourneyarchitecture。

An image of a house for a pianist, designed by Tim Fu using Midjourney. Source: Tim Fu

Created by Jon Henning

在工作中,建築師使用 Midjourney 在項目的最初階段建立情緒版 (mood board)。目前 Midjourney 生成的圖像僅能作為草圖,用來激發靈感。建築師將這些草圖翻譯成圖紙,並建模和進行結構分析,開發出 3D 模型後,建築師會再將圖像反饋給 Midjourney,進一步迭代建築圖紙。不過近期發佈的 ControlNet 將會進一步深入設計工作流。

情緒版 (mood board)是指一系列圖像、文字或樣品的拼貼組合物,用來展現設計師對一個項目的想法或感覺。

NFT 從業者

NFT 無疑也是文生圖的一大應用場景。Midjourney 目前被廣泛應用在 NFT 創作上,因此公司發佈規定,如果在 "與區塊鏈相關的事物" 中使用 Midjourney 生成圖像,需要對每月超過 20,000 美元的收入部分支付 20% 的版稅。

NFTs Created by Midjourney

個人愛好者

Midjourney 使用者群體中不乏個人愛好者,如自媒體群體。文生圖大大降低了藝術創作門檻,使得普通使用者也可以成為藝術家和設計師,並通過 AI 創作獲取收入。

05. Why Midjourney?

Midjourney 是一款 AI 軟體,也是一個垂類 SaaS 產品,引用 Point Nine Capital 的創始合夥人 Christoph Janz 的觀點,垂直 SaaS 產品的成功離不開以下基本原則:對所在行業的客戶有更深入的瞭解;以最好的方式解決他們的具體問題;專門向目標的群體進行行銷/銷售;隨著時間的推移增加更多的功能層,增加 ACV( 平均客戶價值)和粘性。我們在 Midjourney 的產品中看到了以上特點,也在其未來發展規劃中看到了對增加 ACV 和使用者粘性的努力。

驚豔的產品效果

Midjourney 產品定位具體,“瞭解使用者到底需要什麼”,商業可行性強,能在更大程度上提高創意設計的效率。正如 Discord 中的使用者評價:“ Midjourney 超過其競爭對手是因為它生成的圖片都是可以商業化的。” 具體而言,Midjourney 的 prompt 簡短,具有科幻色彩。相比之下,DALL-E2 更偏寫實風格,Stable Diffusion 無風格偏向,但需要更長的 prompt 和更多的嘗試來獲得好的圖片效果。

Book covers

Mobile App UIs, created by midjourney

Prompt 包括圖片內容描述、藝術風格描述、藝術媒介&手段、光線描述、圖片細節描述等等,使用不同的 prompt 可以實現圖片的精細化調節。利用 Midjourney 獲得美術競賽數字藝術類別一等獎的 Théâtre D’opéra Spatial (太空歌劇院),創作者 Jason Allen 經過了 80 個小時的創作、大約 900 次嘗試才完成了這個作品。

但這也反映了目前的圖片生成無法控制,也無法修改。對於使用者是一個黑盒,一方面不知道輸入什麼樣的 prompt 會突然產生好的效果,另一方面即使每次都輸入同樣的詞,每次出來的東西也不一樣。但產品如果要商用化,每一個步驟都應該是有跡可循的。

對於 Midjourney 獨特的藝術風格,Holz 表示,Midjourney 在最佳化模型的過程中是期待製作美好的圖片,激發人類的想像力,而不是復刻現實。Midjourney 不會成為假照片的製造機器。

同時,Midjourney 在質量和速度之間做了“黃金區域”的選擇。最初有 20 分鐘生成高畫質圖片和 15 秒能生成低畫質的圖片兩種演算法。經過測試發現,相較於質量,人們更關心速度,太快也不會帶來更多體驗上的加成。所以最終選擇了 60 秒的版本,比 10 秒生成的質量更高,速度也在人們舒適的範圍內。

以 Discord 為載體的社區互動設計

Discord 為 Midjourney 的啟動提供了絕佳的社交體驗平台,成功將其帶入了大眾市場。一方面 Discord bot 降低了使用者使用門檻;另一方面,圖片創作是一個在討論中不斷迭代的過程,欣賞其他使用者的作品有也助於激發靈感。Holz 在訪談中也提到,不直接做一個 iOS App 的原因是因為人們喜歡藝術共創。Midjourney 迅速成為 Discord 上使用者最多的伺服器,擁有了超 1000 萬名社區成員。

Midjourney 近期擴大了產品的可用範圍,任何人都可以將 Midjourney bot 引入自己的 Discord 伺服器,這將進一步擴大 Midjourney 的使用容量。

Midjourney Discord 社群介面

Midjourney bot

通過資料飛輪和快速迭代,建立護城河

迭代速度對於文生圖軟體非常重要。SaaS 訂閱制的產品模式使其盈利能力取決於圖片效果及成本。而底層技術的飛速進步,必須不斷地迭代模型以緊跟行業發展。其實資料質量及資料標註質量的重要性遠遠超過模型本身。Midjourney 以 PLG 的模式獲得龐大使用者量,形成資料飛輪,能夠根據使用者需求針對性地訓練模型並快速迭代產品,長期來看更有利於建立競爭壁壘。

Midjourney 自發佈以來迭代速度非常快。2022 年 3 月 V1 發佈時仍參考了很多的開源模型;4 月、7 月和 11 月分別發佈了V2、V3 和 V4,迭代出了自己的模型優勢。V4 補充了生物、地點等資訊;增強了對細節的識別能力及多物體/多人物的場景塑造能力。總之,每次迭代都是產品功能的飛躍。

Four generations of Midjourney AI models released in 2022

Midjourney 也在擴展地理版圖。目前已經登錄中國市場,使用微信內測群的方式提供服務。使用者在內測群中艾特 Bot,並輸入關鍵詞,就可以生成 AI 圖片。

逐漸深入設計工作流

Midjourney 替代了 Google Images、Shutterstock、Getty Images、Pinterest、Unsplash 等傳統圖庫平台,使用者不再需要花費數小時搜尋他人的作品激發靈感,而是直接生成,據稱可以將一個月的工作量降低至一星期。

ToB 端,Midjourney 目前還主要在設計工作流初期。因為自訂能力有限,無法調整樣式;也無法與其他平台整合,要生成滿意的圖片需要反覆的嘗試;所以只能用於靈感激發和提高工作效率,對於工作流的滲透並不深入。近期發佈的 ControlNet 使得 Diffusion 模型更好地受控生成圖片,提高了圖片生成的速度和精準度,並可以調整圖片細節,將會進一步深入工作流,改變專業設計行業的生產模式。Midjourney 若要進一步深入工作流需盡快整合 ControlNet。

Twitter: @RamAnanth29

ToC 端,會極大的簡化工作流,比如代替設計師或外包商完成公眾號等自媒體團隊的圖片設計等等。

不可忽視的是,Midjourney 在發展過程中還面臨著潛在風險,如版權問題。David Holz 承認 Midjourney 使用的公開資料集包含了數百萬張未經作者同意的作品;2023 年 1 月,三位藝術家對 Stability AI、Midjourney 以及 DeviantArt 提起了侵犯版權的訴訟。AI 生成作品中還存在著種族歧視及成年內容。雖然 Midjourney 進行了關鍵詞限制,但仍無法完全避免相關內容出現。

Prompt 生態

社區使用者對於 Midjourney 的能力探索熱情極高,目前已經出現了 prompt 的學習交流網站如 promptoMANIA,社群中也流傳著很多 prompt 資料集的公開 Google 文件及文章教學。

Style groups in midjourney — Image by Lars Nielsen

由於用不同的 prompt 獲得的圖片效果差異很大,甚至出現了 prompt 交易平台。PromptBase就是一個包含Midjourney、DALL-E2、GPT-3 等不同平台 prompt 的交易平台,產品定價為 1.99 - 5.99 美元不等,平台抽佣 20%。目前為止,PromptBase 已有 1 萬多名使用者,最受歡迎的內容為 Logo、網站、服裝等商業化設計場景,能夠賣出幾百到幾千次。

Prompt 交易市場之所以能存在,一方面是因為人們表達能力的不同;另一方面是模型內部邏輯的原因,一些看似不合常理的詞語組合卻能獲得意想不到的效果。OpenAI 創始人Sam Altman在採訪中表示,未來的 AI 系統不會因為增補特定詞就產生截然不同的輸出,而是能更好地理解自然語言。所以未來,該平台的價值會被表達能力更強的人捕獲。

06. 團隊背景

Midjourney 正式團隊成員十分精簡,共 11 人。除了 CEO 之外,有 8 位研究與工程師,2 位財務與法務。除此之外,還有 4 位編外顧問,以及 60 位兼職 Discord 營運。

CEO David Holz 高中時便嘗試創意領域的創業,大學主修數學物理學,在攻讀流體力學博士的同時為 NASA 和 Max Planck 工作。之後創立了 Leap Motion,獲得來自 a16z、Founders Fund、Intel Capital 和 JP Morgan 的超 1.2 億美元投資。Leap Motion 的核心技術是手部追蹤技術,想要成為 Metaverse 中的“滑鼠和鍵盤”,但因為 VR&AR 一直難以突破瓶頸,所以“滑鼠和鍵盤”自然也缺乏應用場景。

雖然 Holz 離開了 Leap Motion,但從未放棄 Metaverse 的藍圖,他創立了 Midjourney,或許也期待成為 Metaverse 中的生產力和 “大腦”。Midjourney 團隊的多個核心成員來自 Leap Motion,如 CFO Nadia Ali 和高級研發工程師 Johnathon Selstad。團隊成員及顧問擁有 AI 技術及產品創業的復合背景。這使得 Midjourney 不僅擅長模型最佳化,也能夠理解使用者,打造優秀的產品。

David Holz 認為 AI 不應該被限制,而是人類應該去適應。他將 AI 比作水,既危險,又是文明的驅動力。懂得如何與水一起生活和工作的人類,將有能力在水中游泳、做船、築壩發電,從而更好的生活。同時,他認為文生圖的核心並不是藝術或深度偽造(deepfakes),而是人類想像力的引擎。正是團隊的思維方式使得 Midjourney 的風格充滿了科幻色彩,也使其選擇了 Discord,以最開放的方式面向使用者。

在 2022 年 8 月的採訪中,Holz 表示 Midjourney 目前不以財務回報為動機,也沒有成為上市公司的計畫。只是期待未來十年能夠做對個人和世界有意義的事情,並且從中享受樂趣。

07. 競爭格局

競爭對手

Midjourney 主要的競爭對手為以下幾家使用了 Diffusion 模型的文生圖軟體公司:

科技大廠也在文生圖領域積極佈局,但速度較慢,目前僅僅發佈了理論模型。Apple 若未來將 Stable Diffusion 嵌入 Iphone 中,可能會對行業格局產生較大影響。

傳統設計軟體也積極進入該領域,如 Photoshop 推出 Alpaca 外掛,整合 Stable Diffusion,在 Twitter 上引發轟動,使用者將它描述為“a game changer",流暢的同工作流結合。傳統設計軟體佔據了使用者熟悉的使用場景,且作為產品功能的一部分擁有組合價格優勢,對 Midjourney 構成挑戰。

Midjourney vs. Stable Diffusion

Midjourney 最有力的競爭對手是 Stability.AI,與 Midjourney 的閉源不同,其模型 Stable Diffusion 因開源模式受到了廣泛關注。

Stable Diffusion 於 2022 年 8 月推出,以開源底層程式碼的形式在 HuggingFace/Github 公開發佈。“將 AIGC 交到數十億人手中,實現技術民主化”,使用者可以在其程式碼的基礎上運行或修改,製作自己的應用程式,向終端使用者提供服務。作為稀缺的開源模型,同時有著良好的性能,公測後就受到了廣泛的關注和好評,積累了大量使用者。截止 2022 年 10 月,Stable Diffusion 已經有超過 20 萬開發者下載和獲得授權,各管道累計日活使用者超過 1000 萬。團隊開發的付費線上平台 DreamStudio 目前獲得了超過150 萬使用者,生成超過1.7 億圖片。

Stable Diffusion 的開源優勢在於能夠吸引大量的開發者,最大程度的把模型用起來。開源社區會齊心協力地完善模型文件,共同推進 prompt engineering,解決技術難題。這使得程式碼的迭代速度非常快,最佳化效率遠遠高於閉源系統,使得文生圖行業快速成長和普及。同時社區成員會建立新的 UI,通過擴展現有的功能創造新的用例,因此 Stable Diffusion 模型上長出了繁榮的應用。缺點在於商業化不夠直接,可能為別人“做了嫁衣”。

同時,Midjourney 與 Stable Diffusion 因使用的資料集及模型微調方式不同,在產品層面存在較大差異。

• 產品定位上,Midjourney 是給創意設計群體開發的靈感激發及效率工具。

而 Stable Diffusion 更為開放,在風格變化的多樣性上具有優勢,但獲得想要的圖片效果需要更長的 prompt 和更多的嘗試,同時在特定領域都不如該領域的專業化產品。

• 商業化維度,對比 Midjourney 的閉源與 Stable Diffusion 的開源,Midjourney 商業化層面更為佔優。

因為模型閉源,並通過龐大的使用者量積累了獨有的資料集,可以根據使用者需求不斷地針對性訓練模型,長期來看更有利於建立競爭壁壘。在與 Stable Diffusion 的競爭中,因為其模型的開源,Midjourney 可以隨時整合其模型優勢。

• 使用者獲取層面,Midjourney 最早開放了 Openbeta 版本,短時間獲得大量使用者。

但 Stable Diffusion 的商業化版本 DreamStudio 需要等待 Wait list,而開源模型的本地部署有較高的門檻。Midjourney 獲得大量使用者後,養成了使用者使用習慣,且在開啟付費訂閱後就進一步加強了使用者粘性。

08. 收入估算及未來發展

收入估算

雖然團隊一直表示不在意財務回報,但 Midjourney 具有極強的盈利能力。2022 年 8 月份,創始人 Holz 就聲稱 Midjourney 已經實現盈利。A16Z 也在《Who Owns the Generative AI Platform?》文章中提到 Midjourney 年收入已超過 1 億美金。因為沒有公開收入情況,我們在這裡對它進行一個簡單的估算。

假設 Discord server 使用者(約1081 萬) 的 5% 是付費會員,共 54.05 萬人。若付費使用者的 70% (約 37.84 萬)訂閱每月 10 美元的基本計畫,25% (約 13.51 萬)訂閱每月 30 美元的標準計畫,5% (約 2.7 萬) 是每月支付 60 美元左右的公司使用者。則 Midjourney 目前的收入能達到每月約 945.9 萬美元,年收入 1.14 億美元。

因為 Midjourney bot 可以在所有 server 中使用,所以 discord server 使用者數小於總使用者數。

目前來看,Midjourney 的毛利率約為 80%。Midjourney 搭建在 Discord 上,Discord 會收取約 10% 的手續費。雖不清楚 Midjourney 的模型訓練成本,但 Stable Diffusion 的訓練共使用了 256 張 Nvidia A100,耗時 15 萬小時,成本為 60 萬美元。每次生成圖像的推理在雲端的 GPU 上完成,生成一張圖片的成本約 0.5 美分一張,且未來成本會不斷壓縮。相對於訂閱收入,生成圖片的成本可以逐漸忽略不計。

近期市場空間

Midjourney 為付費訂閱的商業模式,廣泛滲透各個視覺場景。目前付費使用者主要為創意設計人群個人愛好者兩大類。To smb 端,Midjourney 以 PLG 的模式成為專業設計從業者的辦公軟體。ToC 端,Midjourney 成為非專業設計師的工具,以及藝術愛好者的“玩具”。

我們根據客單價付費使用者量建立了以下坐標軸,可以看到,Adobe 作為專業性極強的設計軟體擁有最高的客單價和最多的付費使用者,年訂閱收入遠超其他公司。Midjourney 因剛剛起步,付費使用者量少,但憑藉著較高的客單價,有可觀的增長空間。

對比傳統設計工具,Midjourney 在使用門檻、客單價和目標客戶群的定位上都與 Canva 更為相近,面向更廣泛的 C 端和 smb 使用者。截止 2022 年底,Canva 使用者達到 1.1 億人,證明了全世界至少有 1.1 億人有設計需求。

假設這 1.1 億設計人群中有 5% 會成為 Midjourney 的付費使用者,付費使用者的 70% 訂閱每月 10 美元的基本計畫,25% 訂閱每月 30 美元的標準計畫,5% 是每月支付 60 美元左右的公司使用者。則 Midjourney 的市場空間能達到 12*11000*0.05(0.7*10+0.25*30+0.05*60)=11.6 億美元

所以 ,Midjourney 能看到 10 億美元左右的年營收,成長為百億美金的公司。

未來產品形態

Midjourney 未來可能會有以下幾種發展前景:

1. Midjourney 將目前的圖庫功能做到極致。

目前 Midjourney 替代了 Google Images、Shutterstock、Getty Images、Pinterest、Unsplash 等傳統圖庫平台,成為新的“視覺搜尋引擎”。Pinterest 擁有超 4.5 億月活使用者,若其中的 1% 能成為 Midjourney 的付費使用者,則能達到約10 億美元的營收;樂觀來看,若 5% 能成為付費使用者,則能達到約47 億美元的營收。

2. Midjourney 不再侷限於 Discord ,並且作為外掛接入其他設計產品,仍扮演圖庫功能。如上文提到的 Canva、Adobe 等等,這將進一步增加其分銷管道,觸達更多的付費使用者群。

3. Midjourney 自己開發了端到端的產品,和設計工作流緊密結合,進一步提高客單價。

功能方面,Midjourney 通過不斷整合最新的技術,迭代產品功能,打造產品矩陣。如近期可以通過接入 ControlNet 深入設計工作流,Holz 也稱短期內會在現有產品上增加 Text-to-3D,與 VR&AR 相結合。形態方面,搭建 Discord、網站、本地應用、外掛等多維度產品組合,通過增加產品形態來為更廣闊的客戶群提供服務。

4. 未來多模態模型的發佈改變目前的單點產品現狀,Midjourney 作為功能單一的上層應用,被技術的快速進步所顛覆。

Apple 計畫將 Stable Diffusion 嵌入 Mac 和 Iphone 中,作為使用者熟悉的平台,且使用 Apple 終端推理成本更低、速度更快,也會對 Midjourney 構成挑戰。Midjourney 可能會被整合,變成多功能產品的一個環節,甚至完全被新產品取代。不過 Apple 終端也並非是完美的解決方案,API 的形式將無法對垂直領域的模型進行特定化訓練;將應用放在本地也面臨著使用者資料收集及進一步迭代模型的困難。

雖目前無法看清該行業的終局,但作為 ToC 屬性很強的產品,我們認為 Midjourney 憑藉著獨特的圖片風格及藝術效果、活躍的 Discord 社群帶來的絕佳使用者體驗,在一定時間內能夠保持使用者粘性和較強的盈利能力;團隊的快速迭代能力也讓我們看好其未來的發展前景。

Reference

https://digitalnative.substack.com/p/ai-in-2023-the-application-layer

https://stratechery.com/2023/ai-and-the-big-five/

https://www.forbes.com/sites/robsalkowitz/2022/09/16/midjourney-founder-david-holz-on-the-impact-of-ai-on-art-imagination-and-the-creative-economy/?sh=3028d77e2d2b

https://www.forbes.com/sites/kenrickcai/2022/09/07/stability-ai-funding-round-1-billion-valuation-stable-diffusion-text-to-image/?sh=66afb3b424d6

https://www.bloomberg.com/news/features/2023-01-31/architects-embrace-ai-art-generator-midjourney?srnd=premium-europe

https://learn.g2.com/graphic-design-statistics

https://mp.weixin.qq.com/s/6Fh76q0K0AsyqvFFRrY9Dw

本文來自微信公眾號“海外獨角獸”(ID:unicornobserver),作者:拾象,36氪經授權發佈。

本文經授權發布,不代表36氪立場。

如若轉載請註明出處。來源出處:36氪