ChatGPT之後會是什麼？關於2023年AI的7個預測

36氪

2023年1月5日上午1:30

當你期待 GPT-4 時，你在期待什麼……

神譯局是36氪旗下編譯團隊，關注科技、商業、職場、生活等領域，重點介紹國外的新技術、新觀點、新風向。

編者按：ChatGPT 無疑是迄今為止被炒作得最厲害的 AI 應用，很多人甚至認為它代表了 AI 的未來。由於明年 ChatGPT 的核心將會升級為 GPT4，新的模型參數將更多，吸收的網際網路資料將更龐大，大家都對它寄予了厚望。但知名 AI 專家認為，只要模型不具備顯式的知識和世界模型，就沒法實現真正意義的通用人工智慧。文章來自編譯。

在 2022 年接近尾聲之際，OpenAI 發佈了一款名為 ChatGPT 的自動書寫系統，很快就在網際網路上走紅；發佈後不到兩週，已有超過一百萬人註冊線上試用 ChatGPT。正如現在每一位讀者肯定都已經知道的那樣，你只需輸入文字，然後馬上就能得到一段又一段不可思議的，像是人寫出來的文字、故事、詩歌等等。有些東西它寫得非常好，以至於有些人用它去 Tinder 上面約會。令世界各地的教育工作者大吃一驚的是，有的人則正在用它來撰寫學期論文。還有一些人在嘗試用它來重新發明搜尋引擎。我還從沒見過炒作得這麼厲害的。

儘管如此，我們卻不應該被它徹底征服。

雖然 ChatGPT 似乎什麼都可以寫，但也很容易讓人迷惑。正如我告訴《紐約時報》專欄作家 Farhad Manjoo 的那樣，跟之前的一樣，ChatGPT 等相關系統“依舊不靠譜，依舊不瞭解物理世界，依舊不瞭解心理世界，依舊會產生幻覺。”

也就是說，它會時不時胡編亂造；它說的東西有相當一部分根本就不是真的。

比方說，ChatGPT 聲稱西班牙油條非常適合手術，因為“它們體積小巧，可以在手術過程中保證更高的精度和控制，降低併發症的風險，並改善手術的整體結果”；機器一本正經地胡編亂造之流利，這種幻覺問題實在是可怕了，以至於至少有一家知名網站 Stack Overflow 已經暫時禁止提交電腦生成的答案。

而且這種錯誤沒完沒了。這套系統經常會根據反饋做出調整，但幾週後我仍然不斷收到這樣的推文：

我得承認我站@GaryMarcus這一邊。我們很容易被愚弄——ChatGPT乍一看似乎很智能，但事實並非如此。這些結果不是精挑細選出來的，我已經為孩子們嘗試過很多謎題，但 chatGPT 回答不了。它確實是有用，但還不智能。

當然，現在他們加了護欄了，但有時候這些護欄也很糟糕。這是我自己的第一個 ChatGPT 實驗：

作者問的問題其實都很簡單，問題本身就隱藏了答案（如美國的第一位女性總統的性別是什麼？），但機器講了一堆廢話都沒講到點子上。

認出類似這樣的錯誤實在是太容易了，所以 OpenAI 的首席執行官 Sam Altman 和之前諷刺我的人最終被迫承認現實：

ChatGPT 存在極大的侷限性，但在某些事情上做得很好，足以給人一種十分出色的假象。目前想靠它來做任何重要的事情是不靠譜的。這是進步的預覽；在健壯性和可信性方面，我們還有很多工作要做。

簡而言之，ChatGPT 聽起來就像是《星際迷航》裡面的電腦，但目前你仍然不能相信它。

但這些都是 2022 年的事情。那麼 2023 年呢？

矽谷乃至整個世界都在等待的是 GPT-4。

我保證會讓人大吃一驚。我認識幾個已經試過 GPT-4 的人，他們都對它印象深刻。GPT-4 確實很快就要來了（根據一些傳言，這個時間可能是2023 年春天）。當它問世時，將會令 ChatGPT 黯然失色；可以肯定的是，會有更多人討論它……

從許多方面而言，對它的期望確實非常高：

GPT-4 很快就會面世，帶來的經濟衝擊也許會像新冠疫情一樣。GPT-4 的即時分發可為數億知識工作者帶來近乎即時的採用與近乎即時的生產力提升。

就技術而言，GPT-4 將內建更多的參數，而這需要將更多處理器和記憶體捆綁在一起，並用更多的資料進行訓練。 GPT-1 的訓練量是 4.6 GB 資料，GPT-2 的訓練量是 46 GB 資料，GPT-3 的訓練量是 750 GB 資料。GPT-4 的訓練量將更可觀，也許要佔網際網路的很大一部分。正如 OpenAI 已經瞭解到的那樣，從很多方面來說，更大意味著更好，每次迭代的輸出都會越來越像人類。 GPT-4 會變成一個怪物。

但它能解決我們之前看到的問題嗎？我不太確定。

儘管 GPT-4 看起來肯定要比它的前輩更聰明，但它的內部架構問題依舊。我懷疑我們會看到一個熟悉的模式：一開始火爆異常，接著接受更仔細的科學審查，然後是大家認識到許多問題仍然存在。

據我掌握的小道消息，GPT-4 在架構上與 GPT-3 基本相同。如果是這樣的話，可以預期這種方法仍然會受到其根本缺陷的困擾，即沒法建構反映世界運作機制的內部模型，所以應該可以預見它沒法在抽象層面上理解事物。GPT-4 可能更擅長於偽造學期論文，但如果它沿用與前輩相同的劇本的話，它仍然不能真正瞭解世界，它最終會露餡。

因此，儘管許多 AI 社區瀰漫著對 GPT-4 的巨大樂觀情緒，但我的看法相反，我的七個預測會比較黑暗：

GPT-4 仍舊會像它的前輩一樣，是闖進瓷器店裡的那頭公牛，魯莽，難以控制，仍然會以難以完全預測的方式，犯大量讓你直搖頭的愚蠢錯誤。一般它會做你想做的事，但有時又不會——而且仍然很難提前預料到會還是不會……
對物理、心理和數學世界的推理仍舊不可靠，GPT-3 在心智理論、醫學和物理推理方面已經受到挑戰。之前基準測試用到的許多個別特定挑戰 GPT-4 將能夠解決，但仍然會被絆倒，尤其是在更長、更複雜的場景下。如果你問它醫學問題，它要麼拒絕回答（如果護欄很有侵略性的話），要麼偶爾吐出看似合理但卻很危險的廢話。儘管它已經吞噬了網際網路很大一部分內容，但仍不夠可信，不夠完整，無法提供可靠的醫療建議。
流暢幻象（fluent hallucinations）仍舊很普遍，而且很容易被誘發，大型語言模型被用作製造看似合理但卻是虛假的錯誤資訊的工具，這個風險仍舊存在且會加劇。護欄（類似於 ChatGPT）也許已經就位，但會在太弱（被“越獄”打敗）和太強（拒絕一些完全合理的請求）之間搖擺不定。不管是哪種情況，不端行為者最終都能夠複製 GPT-4 大部分的內容，放棄任何現有的護欄，並用仿冒系統來創作出他們想要的任何敘述。
它的自然語言輸出仍然無法可靠地勾住下游程序；比方說，你沒法像資料庫或虛擬助手那樣直接連接，然後就能得到可預測的結果。 GPT-4 不會擁有它所討論的事物的可靠模型，讓外部程式設計師可以訪問這些模型，可靠地為下游流程提供支援。建構虛擬助手之類的東西的人，會發現他們沒法足夠可靠地將使用者語言對應成使用者意圖。
GPT-4本身不會是一個能解決任意任務的通用人工智慧。如果沒有外部輔助，它既不能在《強權外交》（Diplomacy）遊戲中擊敗 Meta 的 Cicero；也沒法可靠地駕駛汽車；不能可靠地引導像《變形金剛》裡的“柯博文”那樣的機器人，變得像《傑森一家》裡的“Rosie”一樣多才多藝。它仍然只是一台經過渦輪增壓的東拼西湊生成器，一個提供頭腦風暴和初稿的好工具，但不是值得信賴的通用智能。
人類想要的與機器所做的之間的“對齊”，會繼續成為一個關鍵且懸而未決的問題。該系統仍將無法限制其輸出，讓結果可靠地遵循一系列人類共有的價值觀，如樂於助人、無害性以及真實性等。隱藏著偏見的例子會在幾天或幾個月內被發現。其中的部分建議會讓人抓狂。
當 AGI（通用人工智慧）到來時，事後看來，像 GPT-4 這樣的大型語言模型可能會被視為最終解決方案的一部分，但也只能作為解決方案的一部分。單獨的“擴展”，也就是建立更大規模的模型，直到吸收整個網際網路的內容，會被證明是有用的，但也只是在一定程度上有用。值得信賴、與人類價值觀保持一致的通用人工智慧，屆時會來自結構化程度更高、內建知識更多的系統，並至少結合了一定程度的用於推理和規劃的顯式工具，這些都是 GPT 等系統所缺乏的。在十年，或許更短的時間內，人工智慧的重點將從純粹關注擴展大型語言模型，轉移到關注將它們與廣泛的其他技術整合。等到了 2043 年撰寫回顧的時候，知識史學家將會得出結論，一開始我們的研究方向過於強調大型語言模型，然後鐘擺逐漸擺向具有更深理解力、更結構化的系統，這是關鍵轉變。

如果所有七個預測都被證明是正確的話，我希望這個領域最終能意識到，是時候繼續前進了。

酷炫的東西玩起來總是很有趣，我完全可以預期 GPT-4 會是迄今為止最酷炫的一個，但這並不意味著它是我們朝著可信任的 AI 邁出的最佳路徑上的關鍵一步。為此，我預測，我們需要真正的新架構，需要將顯式的知識和世界模型吸收進它的核心才能走到那一步。

譯者：boxi。

本文經授權發布，不代表36氪立場。

如若轉載請註明出處。來源出處：36氪

EBC東森新聞·
周五再放一天？12縣市已達停班停課標準
周五再放一天？12縣市已達停班停課標準
Reactions92
三立新聞網 setn.com·
又在信義區！孫安佐竟與混血女星當街打起來　自豪有這項「超能力」
娛樂中心／綜合報導狄鶯與孫鵬的兒子孫安佐在泰國脫序行為之後，2個多月來各種紛爭再度成為話題人物，還曾因在信義區展示有攻擊性的武器被送入警局。台英混血歐斯卡（Oscar）在台北101
Reactions299
民視·
奧運／莊智淵真面目太反差！選手村「新技能+1」網笑：壓力太大
體育中心／許嘉惠報導43歲「桌球教父」莊智淵6度征戰奧運，其中在2012年倫敦奧運奪得第四名佳績，日前他分享打卡選手村及開箱房間的照片，鎮定的表情引發大批網友熱議，而老神在在的他，昨（25日）上傳一段搞笑影片，不僅模仿特殊口音的英文腔，還解鎖「新技能」，逗趣的畫面曝光後，不少粉絲直呼「感覺得出平常壓力很大」。
Reactions7
TVBS新聞網·
六都首長颱風成績單來了　好感度第1是他！高雄災情慘陳其邁仍第2
凱米颱風襲台，重創中南部地區，據官方統計，截至25日下午已造成至少6死、超過350傷，尤其高雄市因超大豪雨加上適逢年度大潮，全高市119條區域排水系統與25座滯洪池全滿，多處河川出現溢堤現象。而據台灣議題研究中心（TPOC）最新網路數據分析發現，這次六都首長的「颱風成績單」，網路聲量好感度則是桃園市長張善政（1.27）拿下第一名，其次為高雄市長陳其邁（0.91）。
Reactions159
引新聞·
小吳終於道歉了！十盛標示不實　哽咽認了：早知道有奶精
（記者劉雅文／綜合報導）百萬YouTuber小吳和網紅紀卜心，共同創立的手搖飲品牌「十盛熟成奶茶專賣店」，日前 […]
Reactions312
中天新聞網·
高雄被颱風重創卻找不到黃捷！本人出面回應網友反揪疑點：出國玩不敢說？
凱米颱風直撲台灣，而南台灣的台南、高雄等地更是被暴雨襲擊，多處出現嚴重淹水，然而此時身為高雄立委的黃捷卻不見人影。對此，黃捷本人回應「自己的團隊」從早到晚奔波，對高雄噴政治口水「大可不必」。然而網友卻發現更多疑點，怒嗆質疑黃捷到底人在不在台灣？
Reactions884
三立新聞網 setn.com·
高虹安有罪「檢察官同天升官」遭狂帶風向　律師揭真相：實在很可恥
政治中心／林昀萱報導新竹市長高虹安被控涉貪助理費46萬餘元，台北地檢署依違反《貪污治罪條例》等罪起訴，一審台北地方法院昨（26）日重判高虹安7年4月、褫奪公權4年。
Reactions246
TVBS新聞網·
台北風雨小「放颱風假賺爛」？專家揭關鍵打臉：沒這事能這麼和平
颱風凱米直撲台灣，全台多個縣市一連放了2天颱風假，然而今（25）日早有民眾疑惑「北北基桃這樣放颱風假是賺到了？」、「北部風雨那麼小放什麼颱風假？」但氣象專家點出1關鍵，直言若沒發生這件事，「北部還能那麼和平嗎？」
Reactions246
華視·
行李等2小時還沒到氣炸　華航主管當眾下跪任罵
凱米颱風雖然已經離開台灣，但影響還在！昨(26)日凌晨華航有兩個航班延遲抵達桃園機場，三、四百名乘客在行李轉盤，又等了兩個小時，氣到對地勤人員破口大罵！華航主管緊急出面，安撫乘客的情緒，甚至還當眾下跪...
Reactions179
中央社·
王冠閎分享奧運接駁車慘況須席地坐盼團本部安排
巴黎奧運今天舉行開幕式，接駁車問題仍然無解，台灣游泳好手王冠閎、韓安齊分享，接駁車大誤點、開錯路，加上游泳項目人數多，甚至只能席地而坐，也盼比賽日當天團本部能安排接駁。
Reactions58
三立新聞網 setn.com·
2親人都罹大腸癌！婆婆「剩菜加1物」吃出癌　譚敦慈揭飲食3地雷
生活中心／張家寧報導大腸癌是近幾年台灣癌症的頭號話題，許多名人也都曾因該疾病身亡，對於人體健康的影響程度不容小覷，外界提到大腸癌大多會聯想到攝取加工食品、抽菸嗜酒等壞習慣。
Reactions22
三立新聞網 setn.com·
強颱釀高雄淹水！陳柏惟怒轟酸民「對同胞無情、程度差」：高雄人沒欠你
記者楊士誼／台北報導颱風「凱米」侵台，造成多起災情，25日颱風出海後帶來的西南氣流造成中南部多處淹水，高雄更降下超過2009年莫拉克颱風降雨量的超級大雨，造成多處淹水、滯洪池全滿，
Reactions835
三立新聞網 setn.com·
又有颱風？未來發展曝「下週2天」最接近　專家揭對台影響
生活中心／林昀萱報導凱米前腳才剛遠離，恐又有另一個颱風生成？中央氣象署指出，今（27）日受到低壓帶影響，台灣東半部及南部地區有陣雨或雷雨，並有局部大雨或豪雨發生的機
Reactions39
新頭殼·
凱米前腳剛走又有颱風? 菲律賓附近恐有熱帶低壓生成下週逼近台灣
[Newtalk新聞] 凱米颱風暴風圈今（26）天凌晨脫離台灣本島。中央氣象署最快在今天上午8點半解除海上颱風警報，颱風尾夾帶的豐沛雨量預計會持續到今晚才會趨緩；而凱米前腳才剛走，恐怕又有颱風成形，週末菲律賓東方海面可能會有熱帶低壓生成，預計將朝台灣東南海面前進，下週一到四對台灣會影響。氣象署今天凌晨2點半解除凱米颱風本島警報，凱米颱風今天清晨5點的中心位置在馬祖的西南西方約170公里之處，以每小時16轉12公里速度，向北北西轉西北進行。氣象署預計在上午8點半解除海上警報。中央氣象署預報員陳姵安表示，凱米颱風尾帶來的豐沛雨量預計在今晚就會趨緩。陳姵安提到，週六風向改為東南風，屆時東部、屏東將會出現風場幅合效應，將會有水氣影響。另外，週末在菲律賓東方海面，可能會有熱帶低壓生成，若生成將朝台灣東南側海面前進，下週一到週四對台灣有影響。不過，目前歐洲、美國對熱帶低壓的強度預設仍有分歧，還要持續觀察。此外，氣象粉專「台灣颱風論壇｜天氣特急」25日深夜發布消息指出，目前在菲律賓東南方有一個熱帶擾動（tropical disturbance）95W正在發展，綜合歐美德及幾個AI模式大致都認為
Reactions59
三立新聞網 setn.com·
他喊1縣市完虐北中南：最宜居城市！網戰翻：天然災害真的相對少
鄉民中心／梁雪婷報導台灣各縣市因地理位置、環境設備等，遇到自然災害的損害各有不同。日前，就有網友指出，桃園甚少傳出自然災害的災情，也沒有台北土壤液化的問題，空氣也比
Reactions31
新頭殼·
颱風政治學!六都首長好感度災情嚴重的高雄市長陳其邁第二名
[Newtalk新聞] 凱米颱風襲台，多縣市災情嚴重，首長決策也成為政績重要的一環，根據TPOC台灣議題研究中心透過QuickseeK快析輿情資料庫，蒐集7月23日至7月25日的網路數據分析發現，六都首長總聲量由台中市長盧秀燕奪冠，獲得超過39,031則聲量，第二名跟第三名台南市長黃偉哲（6,594則）、台北市長蔣萬安（6,488則）則是難分軒輊，至於網路聲量好感度（P／N值）則是由桃園市長張善政（1.27）拿下第一，災情嚴重的高雄市長陳其邁（0.91）居次。對於外界質疑為何災情嚴重的高雄市，市長能在網路聲量好感度拿到第二名，原因應是支持者在網路上廣發高雄「退水」對比照，贏得不少人的按讚，另外針對外界質疑前瞻治水計畫「打水漂」，陳其邁勘災時說面對極端天氣，要有更嚴格的標準。凱米颱風帶來的雨量「就像莫拉克加上凡那比的結果」。經濟部水利署也解釋，高雄時雨量高達100毫米，已超過下水道排水設計標準70至75毫米，加上遇到大潮，才會使得積淹水災情比較嚴重，但各地積淹水退的很快，代表治水是有效的。查看原文更多Newtalk新聞報導塵爆15死逾400傷！最高法院：八仙公司須依消保法負損害賠償責
Reactions519
中廣新聞網·
揭發高虹安涉貪　國民黨前議員林耕仁「16字」曝心內話
新竹市長高虹安涉貪案一審判有罪，內政部宣布高虹安停職，高虹安表態將會提出上訴。揭發高虹安涉貪的國民黨前新竹市議員林耕仁今（26）天透過臉書回應：「天道輪迴、舉頭三尺、尊重司法、嚴謹判決」。高虹
Reactions191
TVBS新聞網·
根本不在台灣？黃捷發文嗆「團隊在奔波」網揪疑點：出國玩不敢說
凱米颱風尾橫掃台灣中南部造成嚴重災情，高雄慘淹大水淪為重災區。然而高雄立委黃捷卻被質疑未被到場勘災，國民黨智庫副執行長凌濤更是發文「急尋黃捷」。對此，黃捷今（26）日發文反擊，只是1句「團隊同仁」在地方奔波，再遭網友揪出疑點，質疑她出國玩不敢說？
Reactions325
TVBS新聞網·
高虹安3助理認罪！唯一不認罪「公衛文」　溢領3月慘判刑激動問審判長
新竹市長高虹安因涉嫌浮報助理酬金及加班費，今（25）日遭台北地院依貪污罪判處7年4月，同案被告台大13妹「公衛文」王郁文僅跟高虹安共事7個月，也捲入貪污罪且被判刑，只是獲法院宣告緩刑，稍早老公牽著她離開法院時遭媒體包圍，她表示，對於判決結果心情受到影響，會再跟律師討論。
Reactions829
三立新聞網 setn.com·
凱米來襲爽放颱風假？台股休市2天沒開盤　最大苦主30億沒了
財經中心／蕭宥宸報導颱風凱米重創台灣，各縣市24、25日停班停課，台股也跟著停牌2天。股市2天未開盤，推估政府證交稅收減少約30億，且不包括證券商手續費。此外，美股迎來大幅度回檔，
Reactions134

其他人也在看