GPT-4變懶了:轉檔推太長,表格也只給3行!OpenAI怎麼說?AI模型為何會變笨?
24小時全年無休的AI,會想要「偷懶」嗎?近期有大量用戶反應,GPT-4正變得越來越懶散,不再盡心盡力回答問題,而OpenAI也出面表示,他們正在調查這個問題,並且研究如何修復AI模型。
Google剛發布號稱在多個指標上比GPT-4更強悍的AI模型Gemini,在這或許是OpenAI最需要嚴陣以待的時刻,GPT-4近來就被發覺出現了「偷懶」問題,不再詳盡解答用戶的疑問,甚至是拒絕回應、要用戶自己找出答案。
延伸閱讀:「一個詞」讓ChatGPT吐出原始資料!AI模型為何能在無形間出賣你?
GPT-4變懶了,怎麼回事?OpenAI怎麼說?
11月底時,AI工程師克里希南(Rohit Krishnan)就在推特上抱怨,GPT-4變得懶散又沒用,希望交給聊天機器人的各種任務都遭到回絕。「轉換這個檔案?太長了。編寫表格?只給前三行。讀取這個連結?抱歉不行。讀取這個py檔案(python程式)?抱歉不允許。這實在太讓人洩氣了。」他在推文中表示。
提出類似抱怨的不只他一人,創業家麥特.溫辛(Matt Wensing)也指出,GPT越來越抗拒做枯燥的工作,基本上它只會給出一部分答案,然後讓用戶自行解決剩下的部分。
抱怨GPT-4越來越懶的聲浪在網路上日漸攀升,終於OpenAI官方也出面表示,他們已經聽到用戶對於GPT-4越來越懶的回饋,正在研究怎麼解決這個問題,但強調他們自11月11日以來,就沒有動過AI模型。
OpenAI解釋,這個說法並不代表AI自行改變了模型,只是模型的行為可能出現了微妙的差異,導致提示詞出現退化,這種情況通常要用戶及員工很長一段時間才會注意到,並且修復這樣的變化。
GPT-4變笨的事件,也恰好緊接在OpenAI爆出宮鬥大戲之後,至於這齣政變戲碼是否有影響內部的運轉或效率,則暫時未可知。
不過OpenAI強調,發布新模型時他們都會進行包含AB測試在內的各種試驗,依據所有試驗結果確保新模型比舊模型更能帶給用戶幫助,也歡迎用戶持續反應GPT-4可能出現的變化、是否變得懶散,幫助他們即時掌握問題狀況。
延伸閱讀:Google承認Gemini超神影片造假「動了幾刀」!號稱打贏GPT-4,其實很水
GPT-4也曾變笨!實測6月份版本的GPT-4,就比3月版本準確度高多了
事實上,這並非GPT技術首次「學壞」,早在今年6、7月時,就有大批開發者抱怨GPT-4「變笨」了,有時會犯下一些愚蠢的錯誤、沒注意到用戶施加的指令,甚至引發外界猜測OpenAI是否為省錢降低了運算能力、或者調整模型降低成本。
當時OpenAI產品副總裁韋林德(Peter Welinder)公開澄清,「不,我們沒有把GPT-4變笨!」聲稱他們每次更新都是讓GPT-4比以前更聰明,用戶覺得變笨的情況有可能是因為高度使用下,一些過去沒發現的問題暴露出來。
雖然OpenAI強調他們沒有更動模型,但有研究團隊發布報告,用對比今年3月跟6月的GPT-4模型,評估在數學、敏感問題、回應頻率、程式能力、推理能力等諸多面向的表現,其中在數學能力方面, 研究團隊用500道題目讓兩個模型判斷質數,結果3月份的版本以97.6%準確度壓倒性高於6月版本的2.4% 。
AI模型會變笨,究竟是什麼原因?
來自史丹佛及柏克萊加大的研究團隊指出,「我們發現GPT-4和GPT-3.5的表現和行為,在兩個版本中存在顯著差異,並且在某些任務的表現隨著時間越來越差。」他們認為其中一種可能性是 GPT-4已經從思路鏈偏移 ,這是一種將多步驟問題拆解成複數中間步驟,提升大型語言模型推理能力的技術。
對於GPT技術有時莫名出現改變的情況,他們坦承訓練AI模型並不像工業製造般明確,投入什麼原料就知道會製造出什麼產品, 即使是完全相同的訓練材料,在不同次訓練當中,也可能催生出性格、文字風格、評估標準,甚至政治偏袒傾向迥異的AI模型 。
一直以來,AI究竟是如何運作的,常被稱為「黑盒子」,很難從外部去解釋、理解AI是如何做出決策,如此行動的原因等等。即使是引領著生成式AI發展的OpenAI,目前也不明白在沒有更新模型的情況下,GPT-4突然變得懶散的原因,不過再等待一些時間,開發團隊或許將能修復問題,告訴我們GPT-4究竟為何突然發懶。
延伸閱讀:細看GPT-4,還有14個驚人細節!可能會幫助犯罪、人類無法控制?
資料來源:PCMag、Digital Trend、X
責任編輯:林美欣
更多報導
Google最強模型Gemini,背後靈魂推手揭密!Deepmind創辦人如何靠「西洋棋」成功?
「一個詞」讓ChatGPT吐出原始資料,OpenAI出手了!AI模型為何能在無形間出賣你?