代寫論文ChatGPT,背後Open AI揭秘
2022年11月開放使用,一週就湧進百萬用戶的聊天機器人ChatGPT,被全球網友運用發現,可以代學生寫論文、老師看不出;還能代讀研究報告選股;代回客服信函,甚至幫工程師寫程式碼,並通中英文,簡直要害文組理組一起失業。如此強大的AI工具,開發公司是Open AI。而這間公司馬斯克竟是創辦人之一。Open AI還有哪些厲害AI服務等著推?又為何被馬斯克半途拋棄?一文完整揭密。
在向大眾開放對話式語言模型ChatGPT以後,人工智慧研究實驗室OpenAI再度讓普羅大眾驚豔於人工智慧的威力,並且記住它的名字。這也是自2020年推出GPT-3以來,OpenAI開發出的服務又一次席捲社群,也擦亮其在人工智慧領域的領先招牌。不過,說起OpenAI的發展,這次ChatGPT的耀眼表現,並不適合用「十年寒窗苦心鑽研無人聞問,而後一夕成名」來描述,探究其發展經歷,更可說是厚積而薄發。
究竟OpenAI是什麼來頭?為什麼創辦人之一最終退出?科技巨頭微軟看上它什麼?除了ChatGPT以外,OpenAI還開發出什麼人工智慧的有趣應用?《遠見》整理OpenAI的發展脈絡,並盤點其面向人們貼近生活的服務,帶你一次看。
目錄
● OpenAI是什麼來頭?
● 科技巨頭微軟看上它什麼?
● 為什麼創辦人之一最終退出?
● 除了ChatGPT以外,OpenAI還開發出什麼人工智慧的有趣應用?
OpenAI是什麼背景?
OpenAI是一間專攻人工智慧的企業,由非營利的OpenAI Inc.和營利的OpenAI LP所組成。其創辦人大有來頭,分別是特斯拉執行長暨推特新老闆馬斯克(Elon Musk),以及素有新創孵化器美名的創投Y Combinator前總裁亞特曼(Sam Altman)。
根據官網所述,OpenAI希望能夠讓通用人工智慧(artificial general intelligence,簡稱為AGI)造福所有人類,致力於打造出安全且對人類有助益的AGI。
通用人工智慧,又稱為強人工智慧(strong AI),指的是接近、甚至超越人類的人工智慧,在預想中,通用人工智慧能夠像人類一樣具備認知能力,能夠進行邏輯推理,甚至擁有自我意識,因此能夠執行不同種類的任務,用途非常廣泛。其在概念上與應用人工智慧(applied AI)或者弱人工智慧(weak AI)相對,後者的用途相對狹隘,機器僅能學習具有明確目的的任務,例如辨識人臉、下棋、醫療影像判讀、自動導航等。
在人工智慧的發展史上,開發出通用人工智慧,一向是電腦科學界企求卻始終無法實現的渴望。縱使近年來因為電腦運算能力的發展成功度過AI的寒冬,深度學習便宜且有效的落地,主宰人工智慧領域,但目前的眾多應用仍在弱人工智慧範疇,科幻電影裡和人類培養深厚感情的通用人工智慧,仍舊是研究者的失落聖杯。
不過,OpenAI並沒有因此放棄,它挖掘頂尖人才、引入資金,挑戰各類的AI任務,希望能夠朝終焉之地邁進。
科技巨頭微軟看上它什麼?
在創立之初,OpenAI屬於非營利組織,2019年時OpenAI表示,未來希望能夠增加對於運算能力和人才的投資,例如大規模的雲端運算、建造超級電腦等,同時又要平衡它對於夢想的追求,兩者都需要資金,為了增加其募資能力,OpenAI決定成立營利公司OpenAI LP。
雖然OpenAI LP重視營利,但OpenAI當時表示,它相信自己能夠專注於發展新的AI技術,而不是將重點放在商業產品,其同時具有非營利和營利企業的組織架構,讓它不用只看眼前利潤,更能夠深入研究,藉此追求長期回報。
除了初創時投資者與創辦人共同承諾投入的10億美元以外,2019年微軟(Microsoft)加碼投資10億美元,希望透過此次和OpenAI的合作共同發展通用人工智慧,微軟想利用OpenAI先進人工智慧研究的力量,並且相關技術其民主化。
當然,強強聯手不只是做公益,微軟不只成為OpenAI的獨家雲端系統供應商,兩者更合作開發微軟公有雲服務Azure的超級運算技術。而後微軟也推出Azure OpenAI的相關服務,整合進Open AI開發的產品。舉例來說,行銷領域和媒體界的使用者能藉此工具,根據球賽的評論快速生成精華摘要,進而迅速發稿。不僅如此,微軟也把「望文生圖」的DALL-E加到旗下的創作服務和Microsoft 365當中,讓微軟的客戶能夠享受OpenAI的世界級產品。
為什麼馬斯克半路退出?
微軟投資OpenAI時勾勒出的願景如此動人:民主化人工智慧技術、共同開發對人類有益的通用人工智慧,然而,2020年9月時,OpenAI把集結科學家心血、耗費巨資開發的GPT-3獨家授權給微軟,引來外界的撻伐。雖然走向商業化之路無可厚非,但因為OpenAI曾經承諾過要做到開放,因此不是所有人都能夠接受與微軟的合作。
事實上,創辦人之一的馬斯克在2019年2月宣布離開OpenAI,除了因為要專注於處理特斯拉和SpaceX的工程與製造問題以外,馬斯克指出,特斯拉與OpenAI在爭取相同人才,有潛在利益衝突,此外「我並不認同OpenAI團隊想做的一些事情。」
2月馬斯克前腳剛走,3月OpenAI便成立了營利公司OpenAI LP,這很有可能就是馬斯克所說的道不同不相為謀。也因此2020年時見到微軟取得GPT-3的獨家授權,馬斯克在推特上發文抨擊「OpenAI已被微軟俘虜」,縱使微軟技術長暨副總史考特(Kevin Scott)指出,外界仍可以持續使用GPT-3以及其他OpenAI開發出的模型,但馬斯克仍說,如此行為看起來並不像誓言「開放」的組織會做的事。
OpenAI開發出什麼有趣的人工智慧服務?
OpenAI並沒有讓投資人和社會大眾失望,它陸續開發人工智慧創造內容(AI generated content)的模型,並且公開部份成果讓大家使用。
以圖像和文字來說,它們分別推出了輸入文字便能輸出圖像的DALL-E,以及給定圖片後產出描述文字的CLIP。DALL-E和Midjourney相似,使用者輸入各種指令(prompt)的組合,人工智慧便會產製出精美程度甚高的圖像,雖然有時候會出現和物理世界不符的情況,例如不符合人體工學的肢體角度、動物擁有四肢以外的軀幹、出現不可能存在的光影等,但「以文產圖」的結果早已能夠符合大眾的審美。
至於CLIP模型,是利用對比的方式,讓電腦認識不同圖片之間的差異,進而產生判斷,再依此產出文字。它的實用性也不容小覷,平常人們在整理照片時,時常要花時間整理相簿,像是將相片依照過往參加過的活動分類,甚至有些要重新命名方便日後查找。然而,真的要找特定的照片還是很艱難,因為圖片與文字並不共通,例如「自己與家中小狗的合照」或是「塞車街景」,即使在搜尋欄位中輸入小狗或者塞車,也不會跳出正確的結果。
以文搜圖超方便
有了CLIP模型之後,我們便能夠像Google圖片搜尋一樣,利用以文搜圖的方式查找自己的相片。聽起來不是什麼新發明,但CLIP其實已經做到了物體的識別,它不再只是傳統的「這張照片是狗」、「這張圖裡面有動物」,而是能夠正確的認出單張圖片中的不同概念,例如「狗在玩雪」、「夜晚的台北市交通打結」等。
不只有圖像上的突破,OpenAI陸續開發了MuseNet和Jukebox,前者能夠依照使用者輸入的音樂,進一步融合不同風格的演奏,甚至增添樂器,產出新的音樂,它可以模仿莫札特與披頭四,也能用鄉村音樂或者女神卡卡的風格作曲。
Jukebox則往前跨了一步。使用者連音樂都不用上傳了,只要提供類型、音樂人、歌詞,Jukebox便能夠產出接近典型CD品質的音樂片段(即取樣 Sampling 的「樣」),時長約為4分鐘。不過,因為Jukebox產出的品質相對較高,因此訓練時間長達數小時,不像MuseNet僅花以秒計的時間便可完成。
除了音樂以外,OpenAI也開發了將文字描述轉譯為程式碼的Codex,還有擅長玩電動的OpenAI Five。不過,OpenAI最厲害的還是其開發出的GPT相關模型,例如第三代GPT-3,它能夠理解人類語句並做出回應,同時也是這次ChatGPT的基石。
隨著人工智慧的逐步發展,人類在「以文生圖」後反思創作、在「以字產樂」後回顧音樂風格,ChatGPT則讓人們尋找機器與人類相似與相異之處。
有了科技巨頭的鼎力相助,我們要問的問題或許不再是有生之年能否見到通用人工智慧的到來,而要改問還要多久就會到來。到了彼時,人類應該如何自處?又要如何尋找或者肯認生而為人的價值?藉著他者,更能夠觀照自身。在科技奇點來臨之前,我們還有時間能夠不斷反思。
更多精采報導,歡迎加入《遠見》 Line官方帳號!
看更多遠見雜誌文章:
藝術家將被AI取代?人工智慧畫作奪冠,連創造力都能取代人類?
馬斯克被綁架?布魯斯威利講俄文?Deepfake竟成廣告新寵
2023年科技發展趨勢:AI上雲提升商業價值,邁向永續轉型