【AI大軍來襲4-1】流量和成果都被聊天機器人收割 美媒體聯盟與科技公司展開談判

自從大家發現聊天機器人可以與人對話、幫寫論文和編故事後,許多人都對人工智慧的能力讚嘆不已。媒體公司也看見了機器人的厲害,同時也看見了威脅,因為聊天機器人回答的內容,實際上是收集媒體在網路上發布的調查和報導,重新整理給使用者看,間接奪走了讀者。現在媒體公司正準備攤牌,要求這些推出人工智慧的科技巨頭付費。

圖片
ChatGPT母公司為OpenAI,目前許多聊天機器人都是使用OpenAI開發的語言模型GPT-4。路透社

《華爾街日報》報導,美國近2000家出版商組成的「新聞媒體聯盟」(News Media Alliance)正在研究,科技公司在訓練聊天機器人的語言模組時,有多大程度使用了他們發布的材料。

新聞媒體聯盟副主席考菲(Danielle Coffey)說,「那些由我們投資、需經過真人處理的珍貴內容,一直被拿去幫別人創造收益,這一點必須得到補償」。《華爾街日報》母公司「新聞集團」(News Corp)執行長湯森(Robert Thomson)近日在投資人會議上也表示,已和某一方展開談判,「他們使用的是專有內容,顯然是該為此提供一些補償」。

微軟(Microsoft)和谷歌(Google)投資的科技公司OpenAI去年11月推出聊天機器人ChatGPT後引發熱潮。微軟前陣子為自家搜尋引擎Bing推出了類似功能,谷歌的機器人Bard本週也進行公開測試。

這些機器人都能產生和人互動般的語氣,但具體的回應內容則來自其他媒體網站。至於這些資料來源是哪裡來的,機器人不見得會告訴使用者,

影像公司已經提告

不僅聊天機器人,一些繪圖、編曲機器人的成品,也被發現與真人藝術家的原創作品相似,因為科技公司把這些文本、影像或編碼灌輸給機器人,利用各種演算法訓練機器人生成篩選彙整後的內容。

有些藝術家已發起集體訴訟。今年2月,照片資料庫的龍頭蓋蒂影像(Getty Images)也控告人工智慧藝術公司Stability AI侵權。目前為止還沒有涉及語言模型的重大訴訟案,但對文本創作者而言,絞盡腦汁編寫的資料和文句被機器人挪用,也是一樣心酸。

人工智慧公司能否從網路上擷取內容、輸入自己的語言模型,是爭論的焦點。著作權法當中有「合理使用」(fair use)的概念,允許在某些情況下未經授權就使用有版權保護的素材,例如學術目的、教育、新聞報導或評論,但仍須考量引用素材在整個作品當中的佔比。

圖片
AI聊天機器人Replika。路透社

OpenAI執行長奧特曼(Sam Altman)說,為了符合「合理使用」著作權的標準,公司做了很多努力。例如他們的ChatGPT是使用兩年前的資料進行訓練,詢問一些近期事件時,ChatGPT有時會表示它的資訊僅停留在2019年11月。

奧特曼說,針對一些有著作權的內容,公司已經和權利持有人達成交易,「本公司願意為特定領域的優秀資料付費」。

OpenAI去年秋天已和影像公司Shutterstock達成協議,OpenAI可以使用Shutterstock的數據資料,而Shutterstock則開始使用OpenAI的技術。Shutterstock也設立基金,補償那些作品被拿去訓練機器人的藝術家。

仰賴機器人,使用者鮮少查證來源

出版商的其中一個擔憂是,聊天機器人可能會奪走網站流量,影響廣告費用。例如微軟引擎Bing的聊天機器人會在回答時附上來源連結網址,但由於Bing回答得非常全面,讓使用者幾乎不會有點擊連結的動力。

微軟執行長納德拉(Satya Nadella)強調,在和Bing聊天時,相關內容都是可以點擊進去的,只是民眾可能沒有意識到這一點。

擁有入口網站MSN的微軟,多年來一直有付費給出版商,取得內容刊登授權。數名媒體公司高層表示,這個交易並不包含微軟的AI產品,微軟則不予置評。

谷歌的機器人Bard本月21日接受公開測試,被問到《紐約時報》有哪些重大新聞,Bard列舉出一份清單,包含拜登政府決定向烏克蘭提供更多武器援助、對俄羅斯實施新一輪制裁,但是沒有附上《紐時》報導連結,僅用一句「更多消息,請看《紐時》網站」結束這一回合。

圖片
Google紐約辦公室外的標誌。路透社

谷歌表示,公司堅定支持「健康的」內容生態系統,歡迎利益相關者進行對話;日後如果有更多人工智慧工具被併入搜尋引擎,谷歌會優先導流給內容原創者。此外,谷歌也已達成一些協議,同意向《華爾街日報》所屬的新聞集團和其他一些出版商付費,在一個稱為「Google News Showcase」的產品中使用他們的內容。

出版商對科技公司的又愛又恨

知情人士透露,美國上一屆國會已經開始討論如何讓出版商在不違背反壟斷法規的狀況下,對人工智慧的使用發起集體談判,預計這屆國會也很快會重新展開研討,進行相關的商業安排。美國著作權局(United States Copyright Office)上週表示,已針對「在訓練人工智慧時使用受版權保護的素材」等議題發起相關討論。

出版界和大型科技公司的關係本就緊張,但又無法霸氣地割捨。在網路時代,出版商仰賴谷歌、臉書等平台觸及更多受眾,科技公司則靠這些媒體充實了平台內容,因此出版商開始要求科技公司應該付費。

出版商對人工智慧有類似的矛盾。被聊天機器人搶走流量的同時,一些媒體公司也打算擁抱這項技術,《運動畫刊》(Sports Illustrated)、網媒《BuzzFeed》等一些出版商都表示,未來會使用AI工具來創造一些獨具風格的內容。這讓一些出版商在思考是否要爭取科技公司付費時的考量更複雜。

更多太報報導