史丹佛 AI 團隊承認抄襲中國清華系大模型,作者已道歉並將涉事的 Llama3-V 模型撤下

「不僅對的一模一樣,連錯的都一模一樣。」

史丹佛 AI 團隊承認抄襲中國清華系大模型,作者已道歉並將涉事的 Llama3-V 模型撤下(圖/Glenn Harvey)
史丹佛 AI 團隊承認抄襲中國清華系大模型,作者已道歉並將涉事的 Llama3-V 模型撤下(圖/Glenn Harvey)

上月末來自史丹佛的 AI 團隊在網路上高調宣稱,自己 Llama3-V 模型能以區區 500 美元的成本實現超越 GPT-4V SOTA 的效果。但沒過多久,就有人發現 Llama3-V 疑似抄襲了由中國清華大學相關企業面壁智能所開發的 MiniCPM-Llama3-V2.5 模型。兩者的模型結構及程式碼有著很高的相似度,只有在部分變量的名稱上存在差別。

清華簡戰國古文字辨識對比(圖/GitHub)
清華簡戰國古文字辨識對比(圖/GitHub)

很快此事在業內引發了廣泛討論,而面壁團隊在經過對照測試後,也得出了抄襲的結論。最明顯的證據是 Llama3-V 可以和 MiniCPM-Llama3-V2.5 一樣,辨識出來自清華簡(清華收藏的戰國竹簡)上的戰國古文字。而這些古文字數據是面壁團隊親自從清華簡上逐字掃描並手工標註得來,自始至終都沒有對外公開。「不僅對的一模一樣,連錯的都一模一樣。」面壁的成員這麼說道。

面對這樣的鐵證,Llama3-V 背後的作者最終承認了抄襲。在撤下模型的同時,他們也就自己的學術不端行為正式向面壁團隊公開道歉。而面壁對此事的態度相對寬容,CEO 李大海在呼籲同業共創「開放、合作、有信任」環境之餘,也笑稱這「是一種受到國際團隊認可的方式」。

更多內容:

緊貼最新科技資訊、網購優惠,追隨 Yahoo Tech 各大社交平台!

🎉📱 Tech Facebook:https://www.facebook.com/yahootechhk

🎉📱 Tech Instagram:https://www.instagram.com/yahootechhk/

🎉📱 Tech WhatsApp 社群:https://chat.whatsapp.com/Dg3fiiyYf3yG2mgts4Mii8

🎉📱 Tech WhatsApp 頻道:https://whatsapp.com/channel/0029Va91dmR545urVCpQwq2D