【阮嗣宗專欄】什麼算抄襲?哈佛大學校長辭職引發爭議

抄襲是學術界最古老的犯罪行為之一,但克勞丁·蓋伊因抄襲指控而辭去哈佛大學校長一職,引發了一場新的網上辯論:關於何時複製文本應成為應受懲罰的罪行。有些學者甚至主張採用更精簡的出版模式,研究者可以多複製、少寫──只要資訊來源明確。傑夫·托勒夫森 Jeff Tollefson發表在最新一期《自然》(Nature)的<什麼算抄襲?哈佛大學校長辭職引發爭議>( What counts as plagiarism? Harvard president’s resignation sparks debate)說,針對克勞丁·蓋伊的指控讓研究人員對學術標準和實踐產生了爭論。(Allegations against Claudine Gay have left researchers arguing over academic standards and practices.)
哈佛校長因抄襲指控辭職讓學術界感到震驚
對許多人來說,所有研究人員都必須自己寫句子的觀念仍然是一個基本原則,但在一個資訊獲取基本上無限制、人工智慧演算法日益複雜、能夠以令人毛骨悚然的精度再現語言的世界裡,這種觀點可能會遇到新的阻力。
帕薩迪納加州理工學院的計算生物學家 Lior Pachter 表示:「我認為永遠不應該複製別人的話的想法有點過時了。」他補充說,關鍵是確保資訊來源正確。他說,學術界存在更大的問題,包括數據偽造。
在這裡,《自然》深入探討了蓋伊倒台引發的持續爭論,以及人工智慧時代抄襲概念的變化。
為什麼蓋伊成為這場爭論的中心?
12 月 5 日,馬薩諸塞州劍橋哈佛大學的第一位黑人校長蓋伊在美國國會發表了有爭議的證詞。蓋伊與另外兩位大學校長——費城賓夕法尼亞大學的伊麗莎白·馬吉爾(Elizabeth Magill)和劍橋麻省理工學院(MIT)的莎莉·科恩布魯斯(Sally Kornbluth)一起回答了有關以色列-哈馬斯戰爭後校園反猶太主義的問題。他們的回應強調了學校對言論自由的承諾,但未能徹底譴責反猶太主義,引發了廣泛的譴責和對官員的更嚴格的審查。
與此同時,一群保守派活動人士和出版物提出了一系列指控,指控蓋伊抄襲了她的博士論文和學術文章的部分內容。蓋伊的支持者認為這起事件是一次出於政治動機的攻擊,在沒有進行透明和徹底的調查的情況下,直率地應用了硬性的抄襲規則。
學術界現在正在為更多的事情做好準備。推動驅逐蓋伊的億萬富翁捐助者比爾·阿克曼 (Bill Ackman)承諾,將檢查麻省理工學院以及其他可能的機構的所有教職人員和董事會成員的工作中是否存在抄襲行為;就在幾天前,《商業內幕》(Business Insider)披露了針對阿克曼妻子內裡·奧克斯曼 (Neri Oxman) 的類似剽竊指控,內裡·奧克斯曼曾在麻省理工學院擔任研究材料和設計的教職。
那麼大家對於什麼是抄襲達成一致了嗎?
很少有人會反對美國政府的定義,該定義將剽竊稱為「盜用他人的想法、過程、結果或文字,但沒有給予適當的認可」。但協議似乎就到此為止了。
一些剽竊學者表示,蓋伊顯然是在沒有正確出處的情況下複製了文本。她同意在上週辭職前對她的論文和其他論文進行一些更正。對某些人來說,這是維護公眾對科學的信任所必需的。哈佛大學科學歷史學家 Naomi Oreskes 表示:「我們偶爾都會犯錯誤,但一旦事實證明她的研究存在不少問題,我認為蓋伊校長下台是至關重要的。 」
ChatGPT 和其他人工智慧工具如何顛覆科學出版
其他人則認為,所謂的違規行為至多只是輕微的疏漏。他們說,蓋伊是一位政治學家,只是根據她的領域規範總結了科學文獻,與她自己的學術無關。伊利諾伊州埃文斯頓西北大學的政治學家阿爾文·蒂勒里(Alvin Tillery) 說:「剽竊指控爆發的那天,走廊裡的反應有點像,『好吧,我想我們都是剽竊者。』」他在他們作為研究生研究人員的時間。
這些爭議凸顯了評估剽竊指控時面臨的一個獨特挑戰:官方定義沒有區分一些人認為無害的借用短語和大規模盜竊思想和散文。一些學者現在呼籲制定規則以提供明確性。
此外,位於伊利諾州芝加哥的全國研究誠信官員協會主席勞蘭‧誇肯布希 (Lauran Qualkenbush) 表示,抄襲本身並不構成研究不當行為。她指出了學術研究主要資助者美國國家科學基金會(NSF)對研究不當行為的定義。美國國家科學基金會表示,要被視為不當行為,必須有證據證明抄襲是故意、故意或魯莽地進行的,並且它代表了相關學科「明顯背離公認的做法」。「背景很重要,」誇肯布希說。
這對那些母語不是英語的人尤其有利
蓋伊身上發生的事情促使一些科學家質疑要求學者在每篇新論文的引言和方法部分重新總結已知事實的價值。在一種被稱為「模組化寫作」的方法中,研究人員可以更自由地從同行的工作中進行採樣,以描述更廣泛的科學文獻,前提是他們引用了來源。蓋伊辭職後,理論物理學家兼作家薩賓·霍森菲爾德 (Sabine Hossenfelder) 在社交媒體平台 X 上寫道,這對那些母語不是英語的人尤其有利。霍森菲爾德寫道:「如果對別人的文本進行微小的更新就可以的話,我們完全沒有必要要求每個人一遍又一遍地用自己的話總結他們研究領域的最新技術。」
帕切特將這個想法比作電腦科學中的常見實踐,在這一領域,程式設計師經常在彼此的工作基礎上進行建構。他說:「如果每次有人建立新軟體時都必須從頭開始,那就太奇怪了。」他指出,在某些版權許可下,科學家已經被允許複製和貼上論文的整個部分,並註明出處。
俄亥俄州哥倫布多明尼加大學的剽竊學者邁克爾多爾蒂表示,即使學術界發生這樣的變化,引用來源的基本規則也不應該發生。「如果我們沒有歸屬,那麼我們就無法對所表述的內容的真實性和可靠性負責,」多爾蒂說。「我們不能失去責任。」
人工智慧如何改變抄襲檢測的遊戲規則?
蓋伊作品中存在問題的段落是由軟體識別出來的,該軟體可以檢查文本與幾乎所有數位化出版物(從同行評審期刊到維基百科)之間的匹配。誇肯布什表示,何時使用此類軟體(如果有的話)通常由教授、機構和機構決定,而且做法各不相同。例如,美國國家科學基金會透過此類軟體運行所有撥款申請。許多學術期刊,包括《Nature》(《Nature》的新聞團隊獨立於其期刊團隊),也使用該軟體來檢查稿件。
抄襲專家表示,該軟體有其限制。首先,它無法捕獲所有匹配文字的實例,這項挑戰只會隨著人工智慧的使用而增加,例如聊天機器人 ChatGPT,它可以交換單字並重寫輸入的文字。抄襲檢查軟體也無法解釋學術規範和標準化定義,也無法評估複製的文本是否真正抄襲或它是否是論文結論的核心。
道特里說,隨著人工智慧的成熟,抄襲的概念甚至可能有一天會消失。「當你可以輕鬆生成新文本時,為什麼還要複製文本?」