為什麼說ChatGPT還不是搜尋引擎的對手

1950年,英國科學家圖靈在一篇論文中預言,人類有可能創造出具有真正智能的機器。

著名的「圖靈測試」就此誕生:如果一台機器能夠與人類展開對話,而不被辨別出其機器身份,那麼稱這台機器具有智能。

也是從那時開始,人類世界開始了對人工智慧長達半個多世紀的探索,但至少在2000年以前,困難總比驚喜多,人工智慧還經歷了兩次發展寒冬:

一次是在1974-1980年,受限於計算器計算能力,AI技術研究遇冷,研究資助被大規模縮減甚至取消;另一次是在1987-1993年,期間人工智慧電腦DARPA的失敗為AI潑了一盆冷水。

失敗也不全是壞事。跌跌撞撞盛衰起伏的過程中,AI的發展在2006年以後邁進了新的階段——由機器學習邁入了深度學習階段,離真正的人工智慧更近。

自此之後,人類對AI的探索之旅明顯加快,一些重要的里程碑時刻相繼出現了。比如2014年,第一台通過圖靈測試的電腦誕生,它讓人類相信它是一個13歲的男孩;比如2016年,ALphaGo戰勝圍棋世界冠軍李世石。

再到2022年底,ChatGPT一夜爆火。

不過,縱觀AI的曲折處理程序,技術與實驗成功之間隔著一道牆,實驗成功與大規模應用之間又隔著一道牆,應用落地與最終的商業化之間,也隔著一道牆。

這導致,我們依然無法對AI的處理程序抱有太高的期待,包括當下火熱的ChatGPT。

一、ChatGPT為什麼能爆火?

2022年下半年,科技界最受矚目的大事件,莫過於美國的人工智慧研究公司OpenAI發佈了ChatGPT。

ChatGPT是一個智能對話系統,使用者在註冊後,能夠對這個系統發出各種各樣的提問,系統自動生成答案。

最開始,沒有人會想到,這樣一個只是提供人機交談的系統,卻成了2022年全球最後一個爆款產品。

OpenAI 11月30日發佈了它,短短一週後,全球範圍內已經至少有100萬人在使用它。

OpenAI的公司估值也水漲船高。根據媒體1月10日的相關報導,微軟計畫向OpenAI投資100億美元(合人民幣677.51億元)以收購其49%的股權,目前雙方正在談判,預計OpenAI投後估值將達到290億美元。

再到1月12日凌晨,OpenAI在社交平台上表示,其開始考慮對ChatGPT進行收費,以實現商業化,可能包括ChatGPT Professional(專業版)、每月訂閱付費等方式。

短短半個月的時間,ChatGPT實現了一定程度的規模化、贏得了高估值、還將商業化提上日程,它的成長速度足以令人咂舌。

ChatGPT能短時間內爆火的原因,數智界認為有兩點:

第一,從表層來看,ChatGPT表現得更聰明了。

ChatGPT不只能回答簡單的知識性問題,還能夠回答開放式問題,並且能與使用者進行多輪對話。比如使用者此前在社交媒體上分享的問題中,就包括了讓ChatGPT寫程式碼、與ChatGPT聊人生哲學、讓ChatGPT寫詩等等。

在很多問題場景下,ChatGPT都給出了出乎意料的回答。比如下面這段,ChatGPT用魯迅的文筆描述網友的心情:

“在疫情的蔓延中,我困了門裡,困了心裡。屋外一片荒涼,想起一頓火鍋的香味,瞬間讓我心慌。這時候我才知道,疫情來臨,它讓人生無聊而悲涼,也讓我們看到自己的無助與弱點。然而我們又豈能放棄對美好的追求,豈能把慾望壓抑到不想吃火鍋的地步?”

第二,ChatGPT的走紅背後,AI大模型正在成為行業趨勢。

人工智慧中,NLP(自然語言理解)是一個核心概念,被稱作是人工智慧皇冠上的明珠。

在NLP中,之前往往需要對單個小任務進行訓。比如要讓AI掌握對話的能力,需要一個小模型、要讓AI學會協作,需要另一個小模型、要讓AI能閱讀能理解,又需要另一個小模型。

但是人工智慧從機器學習階段邁入到深度學習階段之後,現在單個大模型就可以完成各種類型的任務訓練,也就是對不同問題在同一個模型上進行預訓練。

深度學習裡有個Double Descent現象:隨著模型參數變多,測試錯誤率會先下降、再上升,然後第二次下降。原則上,在成本可接受的情況下,模型越大,精準率越好。

具體到ChatGPT的發展來看:

2018年第一代GPT面世時,OpenAI還只是用它來做語言理解方面的任務;

2019年GPT-2,得益於更高的資料質量和更巨量資料規模,其生成的故事在流暢度和邏輯性上更加完善;

2020年的GPT-3,更加完善成了一個大型語言預測和生成模型,能夠生成長序列的原始文字,語言處理更強大、更快,甚至無需任何特殊的調優;

再到當前的GPT-3.5,則是一個多模態大模型,比起之前的版本更加成熟、精準率越高。

二、ChatGPT的商業化前景如何?

僅當前來看,ChatGPT的表現已經帶給了人類驚喜,但必須要知道,它現在依然面臨著一些缺陷。

比如在回答某些問題時,它可能給出看似合理、實則是錯誤乃至荒謬的回答;比如你反覆問同一個問題,但是用不同的話術,很可能會得到前後不一的答案;比如它的很多回覆過於冗長;比如它現在還無法完全拒絕一些不合理、不道德的請求;

但這些問題的存在並不會完全阻斷ChatGPT的商業化路徑,OpenAI考慮通過專業版和每月訂閱付費開始商業化,就說明了這一點。

國海證券在一份研報中指出,隨著ChatGPT的不斷調優,其有望在醫療、客服機器人、虛擬人、翻譯、行銷、遊戲、社交、教育、家庭陪護等多個領域被應用,潛在的商業模式存在以下幾種:

雲服務——客戶使用ChatGPT的雲服務來支援他們的聊天機器人應用程式;

內容行銷——ChatGPT根據使用者的興趣和喜好向使用者推送廣告;

資料盈利——ChatGPT生成的大量資料,包括會話日誌和客戶反饋,這些資料可以通過出售給第三方或用於改進ChatGPT的功能來變現;

諮詢服務——ChatGPT可以分析客戶對話並提供見解和建議,以改善客戶體驗;

版權授權——ChatGPT可以授權給希望在自己的聊天機器人應用程式中使用其功能的客戶。

當然,以上這些潛在的商業模式,實際上是整個對話式AI都面臨的巨大空間。ChatGPT只是作為其中最具代表性的AIGC文字內容生產工具之一,優勢更明顯。

我們也看到,基於ChatGPT的商業潛力,很多科技巨頭都在加快布局。反應最快也最激烈的,是微軟。

早在2019年,微軟就向OpenAI投資了10億美元,前段時間ChatGPT爆火後,微軟又傳出欲以100億美元收購OpenAI的消息——如若交易達成,這將成為微軟迄今為止最大的一筆投資。

最新的消息是,微軟CEO納德拉表示,微軟計畫將ChatGPT等OpenAI的人工智慧工具整合進公司所有產品,並將其作為平台供其他企業使用。

一個有趣的細節是,此前微軟儘管多年來連續投資OpenAI,但比爾·蓋茨並不喜歡這項投資,他對OpenAI的技術持懷疑態度,認為其部分側重於電腦掌握人類語言含義的能力。

但是在1月12日的一次活動中,當被問及如何看待ChatGPT時,他表示,“這讓我能一窺未來,整個平台的方法和創新速度都令我印象深刻。”態度已然轉變。

三、ChatGPT會取代搜尋引擎嗎?

ChatGPT爆紅之後,其在程式設計、文字生成等NLP領域強大的能力已經引發了部分行業的擔憂。

比如由於ChatGPT擁有基於對話形式接收輸入指令並輸出結果的能力,與傳統的搜尋引擎功能具有一定的重合。

我們也看到,最近搜尋引擎巨頭Google動作頻頻,顯然感受到了ChatGPT帶來的壓力。

據媒體報導,GoogleCEO Sundar Pichai參與了一系列探討GoogleAI戰略的會議,同時公司的研究、信任與安全等部門和團隊,將被組織重整,旨在幫助開發和發佈新的AI原型和產品。

Google還要求員工開發能夠建立藝術品和其他圖像的AI產品,對標的正是OpenAI的另一項產品DALL-E,一個可以根據書面文字生成圖像的人工智慧系統,目前已經吸引到超過300萬使用者。

報導還指出,Google管理層已經發佈了“紅色程式碼”警報。在矽谷,這就意味著拉響了“火警”。

Google擺出積極防禦姿態的同時,關於ChatGPT會不會取代搜尋引擎的討論,也一再升溫。

去年12月,摩根士丹利投行的首席分析師Brian Nowak在一份研報中提到,語言模型可能會佔據市場份額,並破壞Google作為網際網路使用者入口的地位。

專欄作家Parmy Olson也撰文指出,相比Google搜尋抓取十億個網頁內容編制索引,然後按照最相關的答案對其進行排名,包含連結列表來讓你點選,ChatGPT可以直接基於它自己的搜尋和資訊綜合的單一答案,回覆流程更加簡便。

不過就目前階段而言,說ChatGPT可以直接取代搜尋引擎,恐怕還為時尚早。

參考中國銀河證券的觀點,其認為有兩點原因不能忽略:

第一,ChatGPT與傳統搜尋引擎的功能和優勢並不相同。

搜尋引擎是幫助人們做資訊檢索的,人們的檢索行為會返回多條查詢結果、精準率也較高,並且搜尋引擎不會對資訊做出判斷,完全呈現結果供使用者進一步篩選;

ChatGPT則是一個自然語言處理模型,使用者輸入單一指令,只能得到單一結果,以此來確保與使用者對話過程的流暢性。

第二,二者的應用領域不同。

搜尋引擎的資訊庫抓取資訊快、資訊庫更新頻率高、存量大,主要用於幫助使用者快速尋找匹配資訊、找到感興趣的資訊,嘗嘗應用在文獻檢索、網際網路搜尋等領域;

而ChatGPT的語料庫來源於離線資料,輸出的文字存在虛假資訊的可能,且吸納新的知識需要對模型進行再訓練和微調,這會導致訓練成本和甄別成本上升,因此主要應用在人機對話、智能客服、智能問答等強邏輯性的自然語言互動領域。

除了這兩點原因之外,ChatGPT還面臨著資訊老舊的問題。它並不會在網路上抓取即時資訊,知識僅限於2021年之前學到的東西。

基於以上幾點,短期之內,ChatGPT無法取代搜尋引擎,但它可以作為當前搜尋引擎服務的一種補充,也會對現有的搜尋引擎公司產生一定的衝擊,促進巨頭間競爭。

本文來自微信公眾號“數智界”(ID:gh_1eabea2d9bab),作者:祝彰,編輯:嘉辛,36氪經授權發佈。

本文經授權發布,不代表36氪立場。

如若轉載請註明出處。來源出處:36氪