中國 AI 公司 DeepSeek 的新 AI 模型自稱為 GPT-4,是抄襲還是幻想?

就算是幻想,也可能有數據來源違反協議的可能性。

Deepseek v3
Deepseek v3

中國 AI 科技公司 DeepSeek 稍早發表了一個新的「開放」AI 模型,取名 DeepSeek V3。它號稱在降低訓練成本的同時,在多項評比數據上都有與 GPT-4o 或 Claude 3.5 同級,或甚至更佳的表現,並且可以輕鬆完成撰寫文章、程序編碼等工作。然而詭異的是,當你問它是什麼模型時,它卻會回答說自己是 GPT-4,甚至問它 API 如何使用時,它回答的卻是 OpenAI 的 API 的使用方法。

當然,最直覺的反應就是說它是「抄襲」OpenAI,或說是「包了層皮的 GPT-4」,不過事情也不盡然這麼簡單。AI 的模型訓練是要以大量的資料為訓練模板,如果說在訓練時它以其他模型輸出的內容為模板進行訓練的話,就有可能會發生這種狀況。換句話說,DeepSeek V3 有可能是只學習到了「你是什麼模型」這個問題的答案就應該是「GPT-4」,而並沒有理解到應該以自己的名字來進行代換。據 TechCrunch 報導,有人嘗試了 8 次之後有 5 次是回答 GPT-4,而有 3 次是正確地回答了 DeepSeek V3,可見訓練數據應該是兩者都有的。

當然,這並不是說 DeepSeek 就完全沒問題 —— OpenAI 禁止競爭的模型以自己的輸出為基礎進行訓練,所以取決於 DeepSeek 的數據來源,很有可能 DeepSeek V3 還是違反了 ChatGPT 的使用協議。對此 OpenAI 和 DeepSeek 都未有回應。

不過更重要的,這還是突顯出了訓練資料的匱乏所可能沿伸的問題。在許多高品質的文字內容取得不易或價格高昂的情況下,不少模型都會以 AI 輸出的內容來進行訓練。就是算從網路上爬回來的文字,現在也愈來愈難說是不是由 AI 自動產生的。這可能造成的結果就是「天下文章一大抄」,當有不正確的資訊進入到一個 AI 之後,就會不停被一個又一個的 AI 當作真理複製,從而使錯誤資訊或偏見不停地被傳播了。

相關文章: