2023年第一天，請查收ChatGPT的年終總結

36氪

更新時間： 2023年1月1日下午10:40

【新智元導讀】去年，剛剛發佈就火遍全球的ChatGPT，新的一年可能遇見了對手，完全開放原始碼的那種。

ChatGPT的橫空出世，可能是2022年下半年最引人注目的AI突破，雖然可能不是技術含量最高的。

前不久，在新奧爾良舉行的2022 NeurIPS上，關於GPT-4的傳言不絕於耳，與此同時，OpenAI也成為全場新聞媒體的焦點。

OpenAI宣佈了GPT-3系列AI大型語言模型中的一個新模型：text-davinci-003，這是其「GPT-3.5系列」的一部分，可以通過處理更複雜的指令和產生更高品質、更長形式的內容來改進性能。

新模型建立在InstructGPT的基礎上，使用帶有人類反饋的強化學習，使語言模型與人類指令更好地保持一致。

達文西-003是一個真正的帶有人類反饋的強化學習（RLHF）模型，它在人類的演示和高分的模型樣本上使用監督微調來提高生成質量。"

而作為「GPT-3.5系列」的另一部分，OpenAI發佈了ChatGPT的早期演示，該公司宣稱，這個互動式的對話模型，不僅可以回答大量的後續問題，還會承認錯誤，對不正確的提問前提提出質疑，拒絕不適當的提問請求。

OpenAI在部落格中表示，ChatGPT的研究發佈是「OpenAI迭代部署越來越安全和有用的AI系統的最新步驟。它吸取了從GPT-3和Codex等早期模型部署中的許多經驗教訓，在利用人類反饋的強化學習（RLHF）時，有害和不真實的輸出結果大幅減少。

另外，ChatGPT在訓練中強調，它是一個機器學習模型，這可能是出於避免前不久Google的聊天機器人LaMDA引發的「AI是否有意識」的爭議。

當然，ChatGPT也有局限性。

在部落格文章中，OpenAI詳細介紹了它的侷限性，包括有時答案聽起來似乎很有道理，但實際上是不正確或無意義的事實。

「解決這個問題是很有挑戰性的，因為 (1) 在強化學習訓練期間，目前沒有保證一定有可靠的來源；(2) 訓練模型更加謹慎，會拒絕可能正確回答的問題；(3) 監督訓練可能誤導模型，因為理想的答案取決於模型知道什麼，而不是人類演示者知道什麼。」

Open AI表示，ChatGPT 「有時會對有害的指令做出反應或表現出有偏見的行為。我們正在使用API來警告或阻止某些類型的不安全內容，但預計目前會有一些錯誤的否定和肯定。我們非常願意收集使用者的反饋，幫助我們正在進行的工作，改善這個模型」。

雖然ChatGPT可能還有很多亟待改進的問題，但我們不可否認，在GPT-4登場前，ChatGPT仍然是目前大型語言模型的頂流。

不過，最近的社群中，又有一個新的模型點燃了大家的討論熱情。最關鍵的是，它還是開放原始碼的。

本週，負責對包括Meta的Make-A-Video在內的閉源 AI系統進行逆向工程的開發人員Philip Wang發佈了PaLM + RLHF，這是一種文字生成模型，其行為類似於ChatGPT。

程式碼地址：https://github.com/lucidrains/PaLM-rlhf-pytorch

該系統結合了Google的大型語言模型PaLM和強化學習與人類反饋（RLHF）技術，建立了一個幾乎可以完成ChatGPT任何任務的系統，包括起草電子郵件和建議電腦程式碼。

PaLm + RLHF的力量

自發佈以來，ChatGPT因能夠生成高畫質晰度的類人文字，並能以對話方式對使用者問題做出回應，因此在科技界掀起了一場風暴。

這雖然是聊天機器人發展初期的重大進步，但人工智慧領域的許多擁躉對ChatGPT的封閉性表示擔憂。

時至今日，ChatGPT模型仍然是專有的，這意味著公眾無法查看其底層程式碼。只有OpenAI真正知道它的工作原理以及它處理的資料。這種缺乏透明度可能會產生深遠的影響，並可能長期影響使用者的信任。

許多開發人員一直渴望建構一個開源替代方案，現在，它終於到來了。PaLM + RLHF是專門為Python語言建構的，可以為PyTorch實現。

開發人員可以像訓練自回歸transformer一樣輕鬆訓練 PaLM，然後使用人類反饋訓練獎勵模型。

和ChatGPT一樣，PaLM + RLHF本質上是一種預測單詞的統計工具。當從訓練資料中輸入大量示例時——如來自Reddit的帖子、新聞文章和電子書——PaLM + RLHF會根據諸如周圍文字的語義上下文等模式，學習單詞出現的可能性。

真有這麼完美？

當然，理想和現實之間還存在著不小的差距。PaLM + RLHF看似完美，卻也存在各種問題。其中最大的問題就是，人們現在還不能使用它。

要啟動PaLM + RLHF，使用者需要編譯從部落格、社交媒體、新聞文章、電子書等各種來源獲取的千兆位元組文字。

這些資料被提供給經過微調的PaLm模型，該模型將生成幾個回應。例如，如果詢問模型「經濟學的基礎知識是什麼」，PaLm會給出諸如「經濟學是研究……的社會科學」之類的回答。

之後，開發者會請人對模型生成的回答從好到差進行排名，並建立一個獎勵模型。最後，排名用於訓練「獎勵模型」，該模型採用原始模型的回應並按偏好順序對它們進行排序，過濾出給定提示的最佳答案。

然而，這是一個昂貴的過程。收集訓練資料和訓練模型本身並不便宜。PaLM有5400億個參數，即語言模型從訓練資料中學習到的部分。2020年的一項研究表明，開發一個只有15億個參數的文字生成模型的費用高達160萬美元。

今年7月，為了訓練擁有1760億個參數的開源模型Bloom，Hugging Face的研究人員耗時三個月，使用了384個輝達A100 GPU。每個A100的價格高達數千美元，這不是任何普通使用者所能承受的成本。

此外，即使完成了對模型的訓練，運行PaLM + RLHF大小的模型也不是件易事。Bloom配備了八個A100 GPU的專用PC，而OpenAI的文字生成GPT-3（具有大約 1750 億個參數）的運行成本約為每年87,000美元。

AI研究人員Sebastian Raschka在一篇關於PaLM + RLHF的文章中指出，擴大必要的開發工作流程也可能是一個挑戰。

「即使有人為你提供500個GPU來訓練這個模型，你仍然需要處理基礎設施並擁有可以處理的軟體框架，」他說。「這雖然可行，但目前來看，需要付出很大的努力。」

下一個開源ChatGPT

高昂的費用和龐大的規模都表明，如果沒有資金雄厚的企業或個人不厭其煩地訓練模型，PaLM + RLHF目前還沒有取代ChatGPT的能力。

到目前為止，沒有任何關於PaLM + RLHF確切的發佈日期。作為參照，Hugging Face訓練Bloom花了三個月的時間。相比之下，擁有5400億參數的PaLM + RLHF可能需要等待6-8 個月的時間才能誕生一個有意義的版本。

好消息是，到目前為止，我們有三個已知的玩家在開發這個開源版ChatGPT的替代方案：

CarperAI

LAION

Yannic Kilcher

CarperAI計畫與EleutherAI和初創公司Scale AI和Hugging Face合作，發佈第一個可立即運行的、類似ChatGPT的AI模型，該模型經過人類反饋訓練。

程式碼地址：https://github.com/CarperAI/trlx

LAION是為Stable Diffusion提供初始資料集的非營利組織，它還率先開展了一個使用最新機器學習技術複製ChatGPT的項目。

程式碼地址：https://github.com/LAION-AI/Open-Assistant

LAION旨在打造一個「未來助手」，不僅能寫電子郵件和求職信，還能「做有意義的工作、使用 API、動態研究資訊等」。它處於早期階段，但是幾週前，一個包含相關資源的項目已在GitHub上線。

而由油管網紅、AI研究人員Yannic Kilcher建立的GPT-4chan，更像是「出淤泥而全染」的嘴臭達人。

該模型中的「4chan」是一個美國線上匿名論壇，因網友身份皆為匿名，很多人便無所畏懼，發表各種政治不正確的言論。而Kilcher正式用4chan上的帖子對模型進行訓練，其結果可想而知。

與論壇總基調類似，GPT-4chan的回答充斥著種族歧視、性別歧視和反猶太主義。不僅如此，Kilcher還將其底層模型發佈到Hugging Face供他人下載。不過在很多AI研究人員的聲討下，官方很快限制了網友對該模型的訪問。

在我們期待更多開源語言模型出現的同時，現在我們能做的只有等待。當然，繼續免費使用ChatGPT 也是個好主意。

值得注意的是，在任何開源版本正式登場之前，OpenAI在開發方面仍遙遙領先。而2023年，GPT-4無疑是全世界AI愛好者翹首以盼的對象。

無數AI大佬都對其做出了自己的預測，這些預測或好或壞，但就像OpenAI首席營運官Sam Altman所言：「通用人工智慧的建成會比大多數人想像得更快，並且它會改變大多數人想像中的一切。」

參考資料：

https://www.wired.com/story/large-language-models-artificial-intelligence/

https://techcrunch.com/2022/12/30/theres-now-an-open-source-alternative-to-chatgpt-but-good-luck-running-it/

https://metaroids.com/news/an-open-source-version-of-chatgpt-is-coming/

https://venturebeat.com/ai/what-10-top-ai-stories-in-2022-reveal-about-2023/

本文來自微信公眾號“新智元”（ID:AI_era），作者：David 昕朋，36氪經授權發佈。

本文經授權發布，不代表36氪立場。

如若轉載請註明出處。來源出處：36氪

CTWANT·
唐治平拒認屍「母躺冰櫃逾14天」　警下最後通牒…演藝工會理事長霸氣相助
[周刊王CTWANT] 警方透過親屬指認、監視器畫面、社區鄰居以及死者證件確認頂樓的遺體為唐母，唐治平卻堅持不認屍，領取相驗屍體證明書時，以衣服顏色及風格不符、母親腳很細等原因，強調「我看到就不是我母親，我怎麼會是死者家屬？」更表示如果母親失蹤1個月不排除報警。警方指出，針對無主...
Reactions22
民視·
才認了江宏傑當老公！38歲米可白鬆口「去產檢」驚人近況震撼
娛樂中心／曾郁雅報導女星米可白曾經於2014年與「尾牙大王」謝銘傑有過短暫5年婚姻，2019年恢復單身的她，情感狀態備受注目的米可白更被拍到曾經與建築業小開熱戀，近日則傳出與合作演員孫綻關係密切的消息，不過米可白本人並未正面回應，17日米可白則在社群驚爆自己「等下要去產檢」的近況，讓全網粉絲急忙到場關心。
Reactions103
三立新聞網 setn.com·
19歲男駕新BMW撞毀7車！被爆「做超商大夜貸款72期」網：根本國道猴子
社會中心／綜合報導19歲謝姓男子16日駕駛BMW南下，開輔助駕駛定速功能，一路高速開進楊梅休息站，結果失控先撞上水泥護欄，再撞擊7輛車，造成3人受傷。謝男肇事後看到自己的BMW車頭
Reactions314
TVBS新聞網·
賴政府上任滿月！最新政黨支持度曝光　這黨「不減反增」穩坐龍頭
總統賴清德與新內閣上任即將滿一個月，但《台灣民意基金會》所製作的最新民調卻發現，與之前的施政蜜月期相比，賴清德在6月份的滿意度足足重挫9.8%。另外，在國會改革修法風波持續延燒的情況下，民進黨的政黨支持度反而小幅上升，反觀國民黨及民眾黨則都有下滑趨勢。
Reactions200
Yahoo奇摩新聞（記者潘鈺楨）·
被鼓鼓求婚3個月...大元鬆口還沒登記主因！交往11年靠「漂亮衣服」找回激情
即將上映的電影《愛的噩夢》找來項婕如、林艾璇（大元）演出，大元在片中與交往7年的未婚夫感情趨於平淡，現實生活中她與呂思緯（鼓鼓）愛情長跑13年，談到感情中是否有激情褪去的時候？她坦言沒有激情時當然「有動搖過」，但會想辦法找激情，身邊姐妹們就建議她上網訂購一些「漂亮的衣服」！
Reactions4
太報·
張育成罕見「游擊砲」即將歸國　葉君璋感嘆「台灣不可能這樣養成」
效力美國職棒（MLB）坦帕灣光芒隊的我國旅美好手張育成確定返台參加28日的選秀會，味全龍隊葉君璋總教練有感而發地直言，「台灣不可能這樣養成」。
Reactions3
TVBS新聞網·
烏克蘭大捷！擊落造價百億俄A-50預警機　俄怒發通緝令
美國第10陸軍防空與導彈防禦司令部助理參謀長羅莎娜·克萊門特（Rosanna Clemente）在5月的一場活動中透露，烏克蘭今年年初使用了美國製造的愛國者飛彈系統，在亞速海上空成功擊落一架價值3.5億美元（約新台幣113億元）的俄羅斯A-50預警機。克萊門特將此次行動稱為烏克蘭的「SAMbush」（地對空導彈伏擊）。俄羅斯聯邦偵查委員會如今證實，烏克蘭空軍今年2月在亞速海上空擊落一架俄軍A-50預警機，機上10名機組員死亡，是俄國官方首次承認A-50被烏軍打下。
Reactions81
三立新聞網 setn.com·
館長為狄鶯叫屈！開轟「王X蛋」　孫安佐不忍反擊了
記者鍾智凱／綜合報導資深藝人孫鵬、狄鶯獨子孫安佐，日前在泰國呼麻精神恍惚擅闖民宅，登上國際版面，近日又帶瓦斯火槍現身信義區引發議論，種種行為曾與他合作過的「館長」陳之漢談論此事，直
Reactions246
民視·
高鐵阿姨「暴瘦太嚇人」竟是郭雪芙！真面目判若兩人…網認不出
娛樂中心／許嘉惠報導女星郭雪芙外型亮麗、氣質絕佳，近年演出多部台劇皆有亮眼的成績，更突破自我飾演各種類型的角色，精湛演技擄獲大批觀眾的心。前陣子她飛往英國遊學3個月，近期終於返台工作，不時會透過社群平台更新近況，日前她曬出多張等車照，沒想到她現蹤台中高鐵站竟無人認出，讓大批網友感到扼腕，直呼「竟然錯過了…」。
Reactions14
中時新聞網·
李明依昔與狄鶯教育理念不同　傳「不可能再同台」她回應了
藝人孫鵬和狄鶯的獨子孫安佐近期在泰國呼麻闖民宅，回台直播罵父母，接著又和朋友攜火槍逛信義區，一連串脫序行為，讓狄鶯的教養方式也成了關注焦點。網友挖出過去狄鶯曾和李明依上節目，談到教育理念大不同，甚至有人笑稱這可能是兩人「最後一次同台」。對此，昨(16日)李明依受訪時表示對孫安佐很不捨，認為他沒被外界理解，至於是否不可能再與狄鶯一起上節目？李明依笑稱：「因為我們兩個都太貴了」。
Reactions90
TVBS新聞網·
陸男灑尿靖國神社　日本報復了！撤銷11家旅行社簽證送簽權
本（6）月初，日本東京都千代田區的靖國神社，被一名中國大陸民眾噴漆、灑尿惡搞，掀起當地輿論怒火，被揪出是一位名為「鐵頭哥」的網紅。陸媒今（17）日證實，日本駐廣州領事館通知位在廣東、深圳共11間旅行社，撤銷赴日旅遊簽證送簽權。
Reactions529
TVBS新聞網·
2026民調曝光！他戰新北「藍綠五五開」　黃國昌13%支持度墊底
儘管距離2026年九合一大選還有2年時間，但各政黨都已開始為縣市長選戰布局，其中國民黨究竟會派誰來接棒新北市長侯友宜，更是各界相當關注的議題之一。對此，就有一份最新民調顯示，台北市副市長李四川除了在國民黨內部互比能獲得將近40%的市民支持，還可在「三腳督」戰局中與民進黨不分軒輊。
Reactions101
鏡新聞·
蘿拉現身新片！蔡阿嘎狂酸「髒東西」　「1原因」難打碼
百萬YouTuber蔡阿嘎日前發布聲明，宣布開除涉及不法行為造成公司重大損失的元老級員工「蘿拉」（林沛蓁），消息一出引發熱議。不過在蔡阿嘎昨（17日）上傳的新片中卻仍見「蘿拉」身影，對此，蔡阿嘎也現身直播聊天室諷刺「畫面裡的髒東西避不掉，大家忍耐一下」，並透露不打碼原因。
Reactions64
三立新聞網 setn.com·
中職／U18台灣退日本奪冠　日籍打者攜手讀文化大學！參加測試挑戰選秀
記者張沛嘉／新北報導中職季中選秀20日報名截至，17日聯盟舉辦新人測試會，讓選手可以有獲得球團推薦的機會，其中文化大學有2位從日本來台讀書的選手參加，22歲的豐島顯
Reactions27
三立新聞網 setn.com·
孫安佐經紀人到案：我們不是白癡！關鍵瓦斯火槍失蹤　警：主動交槍送驗
娛樂中心／綜合報導孫鵬、狄鶯兒子孫安佐日前與朱姓經紀人帶瓦斯火槍現身信義區，引發熱議。朱姓經紀人17日晚間現身信義警分局，他到案強調，當天攜帶的火槍沒有殺傷力，皆屬於合法的，可以想
Reactions457
三立新聞網 setn.com·
全台都躲不過！午後暴雨炸到週四「下到發紅」　放晴時間曝
記者葉韋辰／台北報導根據中央氣象署指出，未來一周天氣型態將以高溫悶熱但午後有機會出現雷陣雨為主。由於台灣附近有一道梅雨鋒面即將通過，今（18）日到本周四，全台各地
Reactions27
CTWANT·
年終6個月「每天上班都想哭」　26歲OL不敢離職：出去只能領30K
[周刊王CTWANT] 原Po在Dcard發文透露，自己在泛公股待了快3年，平時自認小心謹慎，但還是會因為職務輪調快速、業務不熟悉甚至不知道業務內容而犯錯，造成她「自行查核時缺失一堆被罵爆」，但還不到賠錢、得罪客戶或送人評程度。然而，明明同樣是犯錯，資深同事可以因為會做人被原諒，「超級...
Reactions76
三立新聞網 setn.com·
豪雨特報解除！全台灣剩一縣市要注意　未來一週天氣一次看
記者陳韋帆/台北報導對流雲系發展旺盛，中央氣象署今(16)日下午發布豪雨特報，新北、基隆、南投地區及桃園至臺中山區慎防大雨，直至2100才解除豪雨特報，但今(16日
Reactions4
中時新聞網·
Melody離婚後幸福肥？遭嘲「像粉紅豬」本人激動曝真相
女藝人Melody（殷悅）近日在主持的節目裡，提到自己是圓肩，所以很少穿平口的衣服。某次難得露香肩出席活動，結果被媒體拍成虎背熊腰，委屈地說：「人家說我是粉紅色的豬。」
Reactions15
民視·
阿Ken入境美國遭攔問職業！手機秀「超神畫面」海關秒變和善臉
娛樂中心／周希雯報導男星阿Ken（林暐恆）出道超過20年，早期經常與納豆合作搭檔搞笑，後來他憑藉幽默又靈敏反應成為知名主持人，手握多檔熱門節目，跨足影視圈也有亮眼，甚至還與「黑寡婦」史嘉蕾喬韓森（Scarlett Johansson）合演過好萊塢大片《露西》，演藝成績極佳。不過阿Ken爆出，有次入境美國時被攔下來問職業，老實回答後還被要求拿出證據，但最後他只秀出手機一段畫面，對方態度馬上180度大轉變，「他就對我很和善」。
Reactions99

PaLm + RLHF的力量

真有這麼完美？

下一個開源ChatGPT

其他人也在看