笑死,ChatGPT竟然出現在論文共同作者欄:我研究我自己,怎麼啦?

ChatGPT竟然成論文的共同作者了?

在去年12月發表的一篇預印本論文中,我們驚訝地發現,作者一欄中赫然驚現了ChatGPT!

論文地址:https://www.medrxiv.org/content/10.1101/2022.12.19.22283643v1.full

ChatGPT這是成精了?

雖然大家都知道,ChatGPT擁有超強的寫作能力,但是,它已經能和人類合作,寫出一篇研究自己的論文了嗎?

(沒準還真行)

帶著一百個問號,小編點開這篇論文開始仔細研究,不過讀完之後,一百個問號變成了一千個。

就是說,並沒有看出哪句話是ChatGPT寫的。只能說,ChatGPT的確在研究中扮演了十分重要的角色。

然而,這就更加讓人困惑了:一個生物學實驗中有了小白鼠參與,小白鼠就可以出現在作者欄裡嗎?(恆河猴、羊駝、兔子、果蠅紛紛表示不服

對此,網友也看懵了:也不知道是他們強迫ChatGPT去參加USMLE考試更有趣,還是讓人工智慧成為論文作者更有趣。

被迫參加考試,還成了論文作者

所以,在這篇論文中,ChatGPT究竟是扮演了怎樣的角色呢?

讓咱們來捋一捋。

文章標題是《ChatGPT在USMLE上的表現:使用大型語言模型進行AI輔助醫學教育的潛力》。

總的來說,就是研究人員讓ChatGPT參加了一個美國的醫學執照考試。

為什麼選擇這個考試呢?

這是因為,這個考試的難度很高,問題非常複雜(無論是語言上,還是概念上),同時呢,又有著高度標準化的規範。

巧了不是,這些恰恰都是AI的強項。

沒有經過專門的訓練或強化,ChatGPT在三項考試中幾乎都及格了,或是接近及格。並且,在ChatGPT的答卷,給了研究者很大的驚喜。

下面咱們來具體說說。

USMILE有多難

美國的醫學執照考試USMILE,涵蓋了基礎科學、臨床推理、醫療管理和生物倫理學。

它的問題在文字和概念上都很密集。

試題的小插圖中,包含大量多模態的臨床資料(包括病史、體格檢查、實驗室值和研究結果),而參加考試的學生,需要做出診斷,鑑別出許多模棱兩可的情景。

論LLM與USMILE的適配性

研究者為什麼看上了ChatGPT作為「小白鼠」呢?

以往的AI模型,主要是深度學習 (DL) 模型,用於學習和識別資料中的模式。

而ChatGPT屬於通用大規模語言模型(LLM)。基於新型AI演算法,經過訓練的LLM可以根據前面單詞的上下文,預測一個給定的單詞序列的可能性。

因此,如果能夠在足夠大的文字資料上進行訓練,那麼LLM便可以生成從未觀察到的新詞序列,而這些語句,都是基於自然人類語言的合理序列。

不許刷題,ChatGPT零準備上考場

ChatGPT之所以強大,是因為它站在GPT3.5的肩膀上。而GPT3.5是在OpenAI 175B參數基礎模型上訓練出來的,另外,它還通過強化和監督學習方法,從網路上獲取了大量的文字資料。

但是這次,ChatGPT是完全的「裸考」了。

這次的試題,是研究者在2022年6月,從USMILE的官方樣題中抽取的376道公開試題。

並且,研究者進行了隨機抽查,確保這些題在2022年1月1日以前並沒有相關內容被收錄進Google索引。

要知道,ChatGPT的訓練資料集就截止在這個時間之前。也就是說,ChatGPT事先並沒有見過這些題。

實驗方法概述

結果,ChatGPT在考試中越戰越勇,精準性不斷提高,這說明,它在不斷學習,不斷完善自己。

到最後,它逐漸逼近甚至超過了USMILE的及格線。

ChatGPT在USMLE中的表現相當優異

另外,在考試中,ChatGPT還會針對問題產生新的見解,這就可以幫助人類更好地理解問題。

在實驗中,研究者引入了一個量化AI生成的解釋中包含的洞察力密度(DOI)。可以觀察到,ChatGPT的DOI在回答精準的問題中,明顯比不精準的問題要高。

這些資料表明,人類學習者如果回答不正確,可以從ChatGPT的輸出中獲得新見解,來進行補救。

就是說,ChatGP不光自己會在全新的試題中自學成學霸,還能用來幫助人類學渣。

總之,最後研究者得出結論:大型語言模型在醫學教育和臨床決策上,都有巨大的應用潛力。

嗯,道理咱都懂,可是論文讀到最後都沒搞明白,ChatGPT怎麼就成共同作者了呢?

莫非是研究者覺得,ChatGPT參加了考試,作了答,所以「對本文亦有貢獻」?

在醫學界,ChatGPT「高產似母豬」

你有沒有發現,醫學領域的研究人員對「GPT」可謂是達到了痴迷的程度。

不僅僅是我們這次的主角,文章最開始提到的那篇也是出自一個「神經科學和生理學研究所」。

而ChatGPT的名字,自去年12月起,更是頻繁地出現在該領域一些經過同行評審的論文當中:

論文地址:https://www.oncoscience.us/article/571/text/

不過,在這篇論文中,ChatGPT是正經寫了內容的,咱們一眼就能看出來。

另外,還有下面這篇論文,ChatGPT在作者欄中,也佔了二分之一的名額。

論文地址:https://www.sciencedirect.com/science/article/abs/pii/S1471595322002517

怎樣才能算是論文作者?

一篇論文怎麼署名,是一件大事。

作者署名賦予了作者名譽,也有重要的學術、社會和經濟意義。

ChatGPT何德何能,和專家們一同登上作者欄呢?

對此,我們問了問ChatGPT是怎麼看的:

其實,關於作者的職責,只需隨手一搜就能找到很多詳細的講解。

既然都是醫學領域的論文,不如我們就來看看ICMJE(國際醫學期刊編輯委員會)都有哪些建議。

簡單來說,可以概括為以下四點:

1. 對研究的思路或設計有重要貢獻,或者為研究獲取、分析或解釋資料;

2. 起草研究論文或者在重要的智力性內容上對論文進行修改;

3. 對將要發表的版本作最終定稿;

4. 同意對研究工作的各個方面承擔責任以確保與論文任何部分的精準性或誠信有關 的質疑得到恰當的調查和解決。

所有被指定為作者的人都應該滿足作者署名的4條標準,而所有滿足以上4條標準者也都應該被確定為作者。未滿足全部4條標準者應該出現在致謝部分。

現在問題來了,ChatGPT符合幾條呢?

參考資料:

https://www.medrxiv.org/content/10.1101/2022.12.19.22283643v1.full

https://www.icmje.org/recommendations/translations/chinese2018.pdf

本文來自微信公眾號“新智元”(ID:AI_era),作者:新智元,36氪經授權發佈。

本文經授權發布,不代表36氪立場。

如若轉載請註明出處。來源出處:36氪