AI 版權訴訟延燒中!傳 OpenAI 將轉型為營利組織,可能如何影響 AI 訓練資料的版權爭議?

近期多間外媒報導,OpenAI 考慮由「有限獲利」的經營模式轉型為營利公司。這樣的改變,是否將徹底踰越版權資料「合理使用」(Fair Use)的界線,導致 OpenAI 在愈演愈烈的版權法律戰中屈居下風?使用者又該注意什麼?若付費使用 OpenAI 的服務,是否有侵權的可能性?

創作者與 OpenAI 的版權之爭

2022 年底 OpenAI 推出 ChatGPT,引發社會軒然大波,除了驚異於生成式 AI 的強大能力,也掀起 AI 是否會影響創作者利益的相關討論,以及對於 AI 訓練資料來源的諸多疑慮。面對訓練過程是否侵害版權的質疑,OpenAI 坦承的確使用了版權內容,唯有如此才能訓練出頂尖的 AI。

去年(2023 年)開始,美國作家協會、紐約時報等單位陸續提告 OpenAI,指控其任意使用創作成果作為 AI 訓練素材,導致自身利益受損。無力負擔法律程序的小型創作者,則是轉向 Glaze 等「對 AI 下毒」的服務,使 AI 無法判讀圖像內容,或是於個人創作頁面上加上「禁止 AI 訓練」字樣,降低 AI 利用自己作品的可能性與正當性。

訓練頂尖 AI、避免版權爭議,兩者似乎有所矛盾,供應商究竟該怎麼選?Adobe Firefly 選擇從源頭下手,全數使用自家版權或公共領域素材來訓練 AI,徹底避免資料訓練的版權問題,甚至喊出「你被告我來賠」,顯示對 Firefly 版權十分有信心;OpenAI 則是持續主張開發AGI(通用人工智慧)是為了造福社會大眾,屬於「合理使用」的範疇。

目前版權訴訟還在進行中,而綜覽各國法規,對於 AI 機器學習、轉化後提供內容的整套流程,尚無明確的法規限制,在具有代表性的判例出現之前,「使用版權資料進行 AI 訓練」是否合法,依然未有定論。此刻,我們或許可以先認識「轉化性使用」(Transformative Use)與「合理使用」兩個概念,一窺未來發展方向。

合理使用到底該如何界定?轉化性使用又是什麼?

「轉化性使用」係指二次利用既有之著作,使其產生新的價值,目前普遍認為「轉化性使用」得以帶來更多創新與可能性,對於文化發展有良好影響。「轉化性使用」概念於 1990 年代由美國法官 Leval 創立,根據朱姣鳳發表之〈美國最高法院有關著作權合理使用轉化性爭議之案例研究〉論文,「轉化性使用」在後續幾年間出現代表性判例後,已經成為許多「合理使用」成立判例中的主要論述。

根據台灣資訊智慧財產權協會理事長陳家駿發表之〈從美國人工智慧擴散模型訴訟案——談生成式AI圖像之著作侵權議題〉,AI 輸入大量資料、生成新的成果是否符合「轉化性使用」,將會大幅影響 OpenAI 是否「合理使用」這些版權內容,並進一步成為多場版權訴訟的重要論述。

回顧這場版權之爭,其實核心在於雙方對於「合理使用」的定義不同。為什麼有這麼多認知落差呢?這是因為,為了顧及整體產業創造力、創作者個人權益兩者間的平衡,「合理使用」的界定在法律上始終留有模糊空間,實務上大幅度倚靠個案判定與既有判決的案例。位處新興領域的 AGI 仍需要大量時間,交由法院來釐清細節、建立新的慣例。

若 OpenAI 轉變為營利組織,將會如何影響版權爭議?

OpenAI 在這段時間不再是非營利組織,甚至傳出轉為營利公司的消息,更進一步影響了判斷「合理使用」與否的要素,讓 ChatGPT 的版權爭議更顯複雜。

根據美國著作權法 107 條,「利用之目的與性質」與「對市場之影響」為評斷「合理使用」與否的重要因素,因此,究竟屬於研究用途或營利用途,將會大幅度影響其合法性。簡而言之,轉化性較高、非營利、不影響原創者收入,代表合理性較高;重複、營利與剝奪原創者收入,則位處光譜的另一端。

面對版權爭議,OpenAI 始終主張自己是「合理使用」,並無侵權疑慮。然而 AI 生成內容是否為「轉化性使用」仍未定案,OpenAI 卻已經從「非營利組織」走向「非營利組織下的營利單位」,後續更可能轉型為「營利公司」。這樣的改變,或許會影響法院的最終判斷。

使用者應該注意什麼?有可能侵權嗎?

若 OpenAI 未來有可能被法院認定侵權,使用者運用 ChatGPT 產出的成果,是否也可能侵權?看待此事,可以先簡單將 AI 分為兩個階段:供應商以大量資料進行訓練(輸入資料),再提供服務給使用者來使用(輸出成果)。目前大多數國家把討論重點落在「訓練 AI」的輸入過程中是否有侵權行為,因此侵權行為人是供應商,使用者即便使用AI產出的成果,也不構成侵權。

然而也有反例存在。根據日本著作權法,無論取得過程是否合法,供應商得以任意使用版權內容進行 AI 訓練,無須取得授權,除非有「超過必要限度」或「不合理損害到版權所有者權益」情形出現,才會造成侵權。在這樣的情況下,侵權行為建立於已生成之作品與既有作品的相似性與依賴性,因此,侵權行為人是實際生成作品的使用者。換句話說,但凡使用者運用AI生成作品,便會產生潛在的侵權風險。

無可否認,AI 目前依然有許多法律上的灰色地帶,隨時跟進、了解當今法律對AI技術的限制,並權衡使用AI的優勢與潛在危險,是每一位AI使用者都必須面對的課題。

參考資料:非池中文策院NeowinThe InformationOpenAI官網MONOLITH LAW OFFICE

更多報導
AI 倫理專家、審查員要做什麼?那些 AI 新時代下的「非理工」新職位
科技業大裁AI責任團隊,未來社群演算法恐任由廣告擺布?
有圖不一定有真相!AI 圖片真假難辨,Google 浮水印工具 SynthID 會是好解方嗎?