OpenAI 與《金融時報》達成策略合作,以後者文章來訓練 AI 模型

可以免除 OpenAI「不告而取」的疑慮。

OpenAI
OpenAI

金融時報》(Financial Times)成為最新一個與 OpenAI 達成協議的新聞機構,雙方在周一的一份聯合聲明中表示,OpenAI 與該報達成策略合作,一方面 OpenAI 將使用《金融時報》的新聞報導內容來訓練其 AI模型;而另一方面雙方也將合作開發新的 AI 產品和功能,以服務《金融時報》的讀者。另外,雙方也指明 ChatGPT 在其回應中若是有包含來自《金融時報》的資訊時,將給予適當的引用來源並鏈接回《金融時報》的原文。

《金融時報》 CEO John Ridding 在一份聲明中表示:「AI 平台應當向出版商支付使用其材料的費用」,並補充說,該報仍「將堅持以人力產出新聞」。 雙方均未披露協議的確切金額,不過今年早些時候,《The Information》報導稱,OpenAI 每年向出版商付出總計 100 萬至 500 萬美元的費用,以換取使用其內容用於訓練其 AI 模型。

生成式 AI 的效果好壞,很大程度上取決於其訓練數據。然而到目前為止,大多數的 AI 公司都是由網路上抓取公開的內容來進行訓練,這除了經常未經創作者的同意外,內容也是經常良莠不齊,且不見得包含最新資訊。 用新聞來訓練 AI 模型是解決這一串問題的好方法,但出版商對於免費將他們的內容提供給 AI 公司持包留態度。 例如《紐約時報》和英國廣播公司(BBC)都禁止 OpenAI 抓取其網站上的內容。

相對而言,OpenAI 算是一直有在與出版商達成協議,來保持其模型的訓練。 去年,該公司與德國出版商 Axel Springer 合作,取得了美國 Politico 和 Business Insider,以及德國的 Bild 和 Die Welt 的新聞來訓練其模型。 該公司還與美聯社、法國的《世界報》和西班牙的 Prisa Media 達成協議。

不過,《金融時報》主要依靠的是月費 39 美元的訂閱模型,如果 OpenAI 引用的內容足夠多的話,這樣的合作是否會影響《金融時報》自身的收益?這可能就要看 OpenAI 總結的文章長度,以及引用連結是否有足夠的吸引力了。