Meta大模型成了“科學造假髮動機”，發佈3天就在爭議中下架

36氪

更新時間： 2022年11月18日下午10:32

Meta最新大模型差點成了“科研造假髮動機”，剛出3天就在爭議中下架。

1200億參數語言模型Galactica，在4800萬篇學術論文和各式教科書、百科等資料上訓練而來。

（與太空堡壘卡拉狄加同名）

其本意是想解決學術界資訊過載，幫助研究人員做資訊梳理、知識推理和寫作輔助，一度被認為是“科研者的福音”，或者“寫論文的Copilot”。

But，一經開放使用，很快就被網友們發現了大問題。

它確實能為自己生成的內容引用文獻，但有時這個文獻並不存在，作者卻是真實存在的人。

它能生成看起來像模像樣的科普文字，但內容卻是完全錯誤的。

△

著名的Gary·AI悲觀主義者·Marcus也來吐槽，Galactica把他的出生日期、教育經歷和研究領域等資訊全搞錯了。

對以上種種問題，馬克斯普朗克智能系統研究所所長Michael Black總結道：

這將開啟一個科學深度造假（deep scientific fakes）的時代。會出現研究者從未寫過的虛假論文，這些論文隨後會被其他真實的論文引用，簡直亂套了。

雖然他也注意到，Galactica的開發者在每個輸出內容後都加了“內容可能不可靠”的警告，但“潘多拉的魔盒一旦開啟，就關不上了”。

事實上他的擔憂不無道理，AI生成內容的速度要比人類快的多，一旦大量被搜尋引擎抓取就有可能出現在前排，甚至被當成正確答案展示在最上面，誤導更多人。

這樣的爭議持續了兩三天，團隊只好無奈宣佈Demo暫時下架，論文和原始碼繼續開放給相關領域研究者。

作為Meta首席科學家，LeCun對這個局面並不滿意。

與他觀點一致的網友認為，Galactica是有幫助且有趣的，只是被個別人濫用了。

本意是好的

Galactica由Meta AI與Papers with Code合作開發。

在論文引言部分，團隊寫到：

2022年5月，arXiv上每天平均新增516篇論文……科學資料的增長速度更是比人們的處理能力快……一個人已經不可能讀完特定研究領域的論文。搜尋引擎不直接組織資訊，維基百科這樣的形式需要人力來維護，研究人員持續為資訊過載感到不知所措。

因此他們提出，語言大模型可以更好的儲存、組合和推理科學知識，並提出一個終極願景：

神經網路將成為科學研究的下一代人機介面，就從這篇論文開始。

本意是好的，而且Galactica的表現也確實不錯。

除了文字、數學公式、程式碼任務之外，它還可以執行化學式、蛋白質序列等多模態任務。

Galactica 1200億參數版本在許多科學類任務上性能超越OpenAI的GPT-3、DeepMin的Chinchilla與Gopher、以及開放原始碼的BLOOM。

然鵝，測試基準畢竟是死的，一旦進入生產環境開放給使用者，還是會出現開發時預料不到的情況。

問題出在哪？

在Hacker News上有人認為，語言模型終究是在“對語言建模”而不是對內容。

就像AI繪畫模型一樣，你讓它畫“騎馬的宇航員”它就能畫出來，雖然這不太可能發生，但是很有趣。

類似的討論也發生在Twitter上。如果你讓AI生成一篇關於“生活在太空的熊”的維基頁面，AI也會試著生成。

有人認為，不，AI需要判斷出這個要求不合理。

關鍵就在於，人們對圖片和文字的要求是不一樣的。

圖片中的內容不合理，人們只會覺得有趣而接受。而文字的內容錯了，那就不可接受。

LeCun則認為這種工具的用法應該是輔助駕駛，它不會幫你寫好論文，只是幫你在過程中減輕認知負擔。

以Google為代表的AI大廠，近年來對大模型特別是生成式模型的發佈非常謹慎，像是對話模型LaMDA和AI繪畫Imagen等都不開源、不給Demo或只給限定場景下的Demo。

另一方面，以Stable Diffusion為代表開放原始碼專案推動了整個領域的技術進步與應用普及，但也在版權和生成有害內容方面引發一些問題。

你更支援哪種做法？或者還有第三條路麼？

Galactica：https://galactica.org/

參考連結：

[1]https://news.ycombinator.com/item?id=33611265

[2]https://twitter.com/Michael_J_Black/status/1593133746282106887

[3]https://twitter.com/paperswithcode/status/1592546933679476736

本文來自微信公眾號“量子位”（ID：QbitAI），作者：夢晨，36氪經授權發佈。

本文經授權發布，不代表36氪立場。

如若轉載請註明出處。來源出處：36氪

EBC東森新聞·
周五再放一天？12縣市已達停班停課標準
周五再放一天？12縣市已達停班停課標準
Reactions92
三立新聞網 setn.com·
又在信義區！孫安佐竟與混血女星當街打起來　自豪有這項「超能力」
娛樂中心／綜合報導狄鶯與孫鵬的兒子孫安佐在泰國脫序行為之後，2個多月來各種紛爭再度成為話題人物，還曾因在信義區展示有攻擊性的武器被送入警局。台英混血歐斯卡（Oscar）在台北101
Reactions225
引新聞·
小吳終於道歉了！十盛標示不實　哽咽認了：早知道有奶精
（記者劉雅文／綜合報導）百萬YouTuber小吳和網紅紀卜心，共同創立的手搖飲品牌「十盛熟成奶茶專賣店」，日前 […]
Reactions300
三立新聞網 setn.com·
高虹安有罪「檢察官同天升官」遭狂帶風向　律師揭真相：實在很可恥
政治中心／林昀萱報導新竹市長高虹安被控涉貪助理費46萬餘元，台北地檢署依違反《貪污治罪條例》等罪起訴，一審台北地方法院昨（26）日重判高虹安7年4月、褫奪公權4年。
Reactions111
華視·
行李等2小時還沒到氣炸　華航主管當眾下跪任罵
凱米颱風雖然已經離開台灣，但影響還在！昨(26)日凌晨華航有兩個航班延遲抵達桃園機場，三、四百名乘客在行李轉盤，又等了兩個小時，氣到對地勤人員破口大罵！華航主管緊急出面，安撫乘客的情緒，甚至還當眾下跪...
Reactions49
中天新聞網·
美媒評選奧運開幕式各國出場團服　盛讚中華隊：把時尚帶進巴黎
2024巴黎奧運開幕式已在稍早舉行完畢，本屆奧運也是史上首次在「水上」的戶外開幕式，各國代表隊選手進場後，隊服也成為外界矚目焦點。其中美國媒體《雅虎體育》就對中華隊的出場服裝稱讚滿滿，「中華隊將時尚帶到巴黎！」
Reactions21
中天新聞網·
高雄被颱風重創卻找不到黃捷！本人出面回應網友反揪疑點：出國玩不敢說？
凱米颱風直撲台灣，而南台灣的台南、高雄等地更是被暴雨襲擊，多處出現嚴重淹水，然而此時身為高雄立委的黃捷卻不見人影。對此，黃捷本人回應「自己的團隊」從早到晚奔波，對高雄噴政治口水「大可不必」。然而網友卻發現更多疑點，怒嗆質疑黃捷到底人在不在台灣？
Reactions878
TVBS新聞網·
台北風雨小「放颱風假賺爛」？專家揭關鍵打臉：沒這事能這麼和平
颱風凱米直撲台灣，全台多個縣市一連放了2天颱風假，然而今（25）日早有民眾疑惑「北北基桃這樣放颱風假是賺到了？」、「北部風雨那麼小放什麼颱風假？」但氣象專家點出1關鍵，直言若沒發生這件事，「北部還能那麼和平嗎？」
Reactions245
三立新聞網 setn.com·
2親人都罹大腸癌！婆婆「剩菜加1物」吃出癌　譚敦慈揭飲食3地雷
生活中心／張家寧報導大腸癌是近幾年台灣癌症的頭號話題，許多名人也都曾因該疾病身亡，對於人體健康的影響程度不容小覷，外界提到大腸癌大多會聯想到攝取加工食品、抽菸嗜酒等壞習慣。
Reactions21
中央社·
王冠閎分享奧運接駁車慘況須席地坐盼團本部安排
巴黎奧運今天舉行開幕式，接駁車問題仍然無解，台灣游泳好手王冠閎、韓安齊分享，接駁車大誤點、開錯路，加上游泳項目人數多，甚至只能席地而坐，也盼比賽日當天團本部能安排接駁。
Reactions55
三立新聞網 setn.com·
強颱釀高雄淹水！陳柏惟怒轟酸民「對同胞無情、程度差」：高雄人沒欠你
記者楊士誼／台北報導颱風「凱米」侵台，造成多起災情，25日颱風出海後帶來的西南氣流造成中南部多處淹水，高雄更降下超過2009年莫拉克颱風降雨量的超級大雨，造成多處淹水、滯洪池全滿，
Reactions825
新頭殼·
凱米前腳剛走又有颱風? 菲律賓附近恐有熱帶低壓生成下週逼近台灣
[Newtalk新聞] 凱米颱風暴風圈今（26）天凌晨脫離台灣本島。中央氣象署最快在今天上午8點半解除海上颱風警報，颱風尾夾帶的豐沛雨量預計會持續到今晚才會趨緩；而凱米前腳才剛走，恐怕又有颱風成形，週末菲律賓東方海面可能會有熱帶低壓生成，預計將朝台灣東南海面前進，下週一到四對台灣會影響。氣象署今天凌晨2點半解除凱米颱風本島警報，凱米颱風今天清晨5點的中心位置在馬祖的西南西方約170公里之處，以每小時16轉12公里速度，向北北西轉西北進行。氣象署預計在上午8點半解除海上警報。中央氣象署預報員陳姵安表示，凱米颱風尾帶來的豐沛雨量預計在今晚就會趨緩。陳姵安提到，週六風向改為東南風，屆時東部、屏東將會出現風場幅合效應，將會有水氣影響。另外，週末在菲律賓東方海面，可能會有熱帶低壓生成，若生成將朝台灣東南側海面前進，下週一到週四對台灣有影響。不過，目前歐洲、美國對熱帶低壓的強度預設仍有分歧，還要持續觀察。此外，氣象粉專「台灣颱風論壇｜天氣特急」25日深夜發布消息指出，目前在菲律賓東南方有一個熱帶擾動（tropical disturbance）95W正在發展，綜合歐美德及幾個AI模式大致都認為
Reactions60
三立新聞網 setn.com·
他喊1縣市完虐北中南：最宜居城市！網戰翻：天然災害真的相對少
鄉民中心／梁雪婷報導台灣各縣市因地理位置、環境設備等，遇到自然災害的損害各有不同。日前，就有網友指出，桃園甚少傳出自然災害的災情，也沒有台北土壤液化的問題，空氣也比
Reactions26
Yahoo奇摩運動·
奧運》戴資穎、孫振掌旗率隊征戰花都開幕式Lady Gaga、席琳狄翁接連開唱同慶
2024巴黎奧運會於台灣時間27日凌晨1點30分正式開幕，中華代表團搭乘第74艘船進場，掌旗官由台灣羽球一姊戴資穎及霹靂舞一哥孫振擔當，代表團共有21位中華健兒、12位教練、6位行政人員參與開幕儀式，巴黎現場雖然下起不小的雨勢，但仍舊抵擋不了大家的熱情，每位選手皆用力揮舞手上會旗，透過轉播鏡頭讓世界看到台灣。
Reactions59
中廣新聞網·
揭發高虹安涉貪　國民黨前議員林耕仁「16字」曝心內話
新竹市長高虹安涉貪案一審判有罪，內政部宣布高虹安停職，高虹安表態將會提出上訴。揭發高虹安涉貪的國民黨前新竹市議員林耕仁今（26）天透過臉書回應：「天道輪迴、舉頭三尺、尊重司法、嚴謹判決」。高虹
Reactions181
三立新聞網 setn.com·
認屍案傳回泰國　唐治平親戚不捨出手了！金援內幕曝光
記者鍾智凱／綜合報導唐治平認母案受到高度關注，日前他受訪時表示：「既然檢警堅持要我認，我就認。」先前他曾指出母親會有百萬保險金部分，他說要拿到母親死亡證明才能領，且
Reactions102
FTNN新聞網·
躲股災選「它」！交易量暴增達42萬張　股價逆勢漲2.93%　網喊：歐印
[FTNN新聞網]記者蔡昀庭／台北報導因凱米颱風侵襲，台股休市2天，今（26日）開盤補跌，重挫982點，摜破22000點，最低達到21931.9點，收22,119.21點。股民為躲...
Reactions28
三立新聞網 setn.com·
關鍵4個月！王義川曝新竹企業家「恐逼高虹安辭職」：辭了黃國昌選不了
記者詹宜庭／台北報導新竹市長高虹安被控涉貪助理費46萬餘元，台北地方法院今（26日）一審判決出爐，依貪污罪高虹安判刑7年4月，褫奪公權4年，可上訴；另依地方制度法第
Reactions120
三立新聞網 setn.com·
高虹安涉貪判7年4月！四叉貓列4人刑期…點名他：最大贏家
政治中心／彭淇昀報導新竹市長高虹安被控2020年擔任立委期間，與其4名國會助理，連手詐領立院公費助理補助共46萬30元，台北地檢署依違反貪污、偽造文書等罪嫌起訴，台北地院今
Reactions102
三立新聞網 setn.com·
高雄淹大水！網批防洪建設　苗博雅不忍了轟：國中程度的知識該有吧？
記者詹宜庭／台北報導強颱凱米直撲台灣，造成高雄嚴重淹水，卻有網友將淹水矛頭指向防洪建設。台北市議員苗博雅昨（26日）表示，一般人閒聊嘴砲就算了，但自稱理性客觀知識份
Reactions428

本意是好的

問題出在哪？

其他人也在看