OpenAI 將付出 2.5 億美元來使用 News Corp 集團的內容

News Corp 旗下擁有《華爾街日報》、《Marketwatch》、《太陽報》等十多個出版品。

Sam Altman
Sam Altman

OpenAI 和旗下擁有《華爾街日報》、《Marketwatch》、《太陽報》等十多個出版品的 News Corp 新聞集團達成一項多年期的協議,讓 OpenAI 可以取用這些新聞提供者現在和過去的內容,並利用這些數據進一步訓練其 AI 模型;而另一邊這些來源的新聞,也將會出現在 ChatGPT 的回應中。雙方均未披露協議的細節,但《華爾街日報》的報導中估計, News Corp 將在未來五年間獲得總價值約 2.5 億美元的現金和等價物。

News Corp 首席執行官 Robert Thomson 在周三發給員工的備忘錄中表示,該協議承認優質新聞業理應有其額外價值。他並提到,數位時代的一個特點是發行者占據主導地位,但往往是以犧牲創作者為代價,許多媒體公司都被無情的科技浪潮所席卷,而現在新聞業有責任充分利用 AI 這個天賜良機,重新奪回主導權。

自 OpenAI 在 2022 年底發布 ChatGPT 以來,生成式 AI 的普及率呈爆炸式增長,但 AI 聊天機器人提供的回覆好壞終究取決於用於訓練其模型的資料好壞。到目前為止,AI 公司大多通過抓取網上公開可用的數據來訓練其模型,而且通常未經創建者的同意。然而,在新聞行業大舉反撲,並對簿公堂後,AI 公司開始逐步與新聞行業達成財務協議,以確保 AI 模型能夠安全無隱患地使用他們的內容來進行訓練。

僅在過去幾個月里,OpenAI 就宣布了與 Reddit金融時報、Dotdash Meredith、美聯社、德國出版商 Axel Springer 以及西班牙的 Prisa Media 等宣佈合作;而在另一頭 News Corp 也在上個月與 Google 達成了一項價值 500 萬至 600 萬美元的協議,用於訓練其 AI 模型。

Google 和 OpenAI 是目前最大的兩個生成式 AI 聊天機器人提供者,因此自然兩者的動作最受矚目,但他們並不是唯一與新聞出版商達成此類協議以訓練其 AI 模型的公司。就在 News Corp 宣布之前幾個小時,《Business Insider》的報道稱,Meta 也在考慮與新聞出版商達成自己的協議以獲取訓練數據。

來自 AI 公司的資金可望為正陷入困境的新聞行業提供另一項收入來源,但反過來說,這也有讓 AI 模型公司「大者恆大」的隱憂,讓資金並不雄厚的小型或新創的 AI 公司被拒在門外,無法取得優質的訓練資料。同時,一些出版商也仍然對達成此類協議持謹慎態度。《紐約時報》目前就因使用內容訓練 AI 系統而起訴了 OpenAI 和微軟,同時《紐約時報》、BBC 和 The Verge 都不讓 OpenAI 從其網站上爬取內容。

相關文章: