ChatGPT支援中文嗎?如何用得更順手?

ChatGPT目前支援中文,雖然速度比不上英文,但仍舊堪用。到底這個由Open AI開發出的超強聊天機器人是什麼?有什麼隱藏版用法,可以協助台灣人跟它說中文,溝通更順暢?其隱憂與爭議又是什麼?在此《遠見》一文完整更新。

【12/22更新】

最近不少中文網友都加入了使用ChatGPT的行列,雖然這個超強聊天機器人中文也通,不過,要怎麼把ChatGPT用得更加順手?也有撇步。在此整理GitHub上awesome-chatgpt專案列出的要點,可以幫助你成為更好的「AI 施咒者(AI Whisperer)」,溝通更順暢。

─到處都可以用ChatGPT:迷上ChatGPT,到哪裡都想跟它聊天嗎?網頁版以外,有瀏覽器的擴充套件(extensions)、桌面應用程式,都可以使用ChatGPT。覺得孤單寂寞嗎?沒關係,有人做出串接Line的聊天機器人,讓你不怕Line沒有新通知。

─分享聊天紀錄:和ChatGPT的談會很精彩,想跟朋友分享嗎?利用擴充套件,就能分享和ChatGPT的聊天紀錄。

─讓ChatGPT扮演不同角色:想不到能和ChatGPT聊什麼嗎?請參考ChatGPT能扮演的角色,像是面試官、旅遊建議、體育解說員,從此不怕沒有專家可以請教。

ChatGPT串接Line的聊天機器人
ChatGPT串接Line的聊天機器人

11月,人工智慧研究實驗室OpenAI釋出對話式語言模型ChatGPT,因為它的用途廣泛、效果強大,因此迅速走紅,一週內就衝出百萬用戶。根據官網的介紹,ChatGPT可以跟使用者對話、回答問題,若是使用者的論點中有錯誤,它也能指正。

目前開放給民眾免費使用的ChatGPT還在測試階段,不過已經有許多人發掘出它的有趣應用,除了對話以外,有學生拜託它回答大學理論課的申論題,也有工程師麻煩它寫程式,或者要求它吟詩作賦,而ChatGPT來者不拒地照辦──品質還驚人地好*(註:ChatGPT並不是真的有求必應,若使用者輸入的內容和仇恨言論、暴力、犯罪等主題有關,ChatGPT不會做出回答,還會提醒使用者這違反了平台的規範。)。

ChatGPT究竟是什麼?為何能有此表現?除了當槍手、做代筆作家以外,ChatGPT還有什麼「用法」?《遠見》整理ChatGPT的用法和其橫空出世的脈絡及現況,帶你一次看。

目錄

●ChatGPT究竟是什麼?
●為何ChatGPT如此厲害?
●ChatGPT有什麼用法?
●ChatGPT支援中文嗎?如何用得更順手?
●ChatGPT有何隱憂?

ChatGPT究竟是什麼?

ChatGPT的開發者是一家專精於人工智慧的組織OpenAI,OpenAI曾經推出輸入文字便能輸出圖像的DALL-E、給定音樂風格和歌詞就可以產出音樂作品的Jukebox,以及2020年推出時震撼全球的語言模型GPT-3。

根據OpenAI的介紹,ChatGPT就和先前曾推出的「打電動機器人」OpenAI Five一樣,都是透過由人類提供回饋的增強學習(reinforcement learning)訓練而成。增強學習的原理類似小朋友在玩電動遊戲,即使在場沒有成年人指導,幼童仍可以在不斷的試錯當中,藉著每次挑戰所獲得的正向與負向回饋,找到能夠通關的策略。

訓練ChatGPT時便是仿照上述概念,OpenAI先請模型的訓練者們同時扮演使用者和人工智慧助手(即現在的ChatGPT)的角色,創造一定數量的數據,讓機器認識到對話的基本策略。接著,為了讓機器學到相對較佳的對話內容與模式,訓練者會扮演使用者向機器擔任的人工智慧助手發話,此時訓練者會提供建議幫助機器撰寫回答。

為了讓機器「學習」,訓練者會擷取機器撰寫的不同語句,接著「告訴」機器回答內容的品質高低。這些線索有如「小朋友齊打交」的正向與負向回饋,機器可以藉此改善產出,並回頭更新其產生回答的策略,就這樣一步一步的離成品邁進。


為何ChatGPT如此厲害?

2016、2017年,AlphaGo接連擊敗圍棋名宿李世乭與柯潔,引發世人們熱議,然而,那畢竟是用途相對狹隘的弱人工智慧(weak AI),相較於在圍棋界獨孤求敗的AlphaGo,ChatGPT的應用場域顯得貼近生活,離泛用、接近人類的強人工智慧(strong AI)更進一步。

不過,ChatGPT仍屬於弱人工智慧的範疇,它的設計目標是模仿人類的對話,背後的運作原理與人類的邏輯推理不同,而是從預先訓練的資料中找尋能夠對應的素材,多番拼湊後產生回答。但是,對一般人來說,機器能夠如此流利的和人們交談,就已經足夠驚人。

ChatGPT的優異表現,很大部分要歸功於它所站立於上的巨人肩膀,也就是GPT-3。

2018年,OpenAI發表論文,主要在討論如利用所謂「通用預訓練(generative pre-training,簡稱為GPT)」改善模型對於語言的理解,這個方法成功克服了當時機器學習研究者的痛點。

對投身人工智慧領域的產學界人士來說,即使技法再精妙、運算資源再豐沛,還是必須投入人力標注資料。舉例來說,在訓練機器判斷醫療影像時,想讓機器向醫生「學習」何謂罹患疾病,就必須讓機器知道每張照片對應到的標籤是陽姓或者陰性。

然而,若要拜託醫師花時間逐一標記影像,必然耗費巨大的人力成本。不只是影像辨識,其他領域亦然,機器生成的文字品質如何改進?人工智慧給人資的履歷篩選建議會不會有遺珠??這些都仰賴人類實際的回饋。

然而,GPT就厲害在它能夠基於無監督(unsupervised,指沒有標籤)的數據,建立起通用的語言模型,接著再針對有監督(supervised,指有標籤)的特定任務逐步微調,如此一來,便成功通過當時科學家遇上的瓶頸。

當然,使用無監督的數據生成模型說來容易,但實務上的挑戰甚巨,因為訓練模型需要大的運算能力,這意味著燃燒資本。

就第一代GPT模型來說,預訓練的數據量達到約5GB,使用到的參數接近1.2億。隔年(2019)OpenAI發表GPT-2,預訓練的數據量暴漲,直接衝高到40GB,使用到的參數更是來到15億。OpenAI並沒有停下腳步,在2020年又釋出了GPT-3,這次的數據量翻了千倍,達到45TB,而參數量也升級到1,750億。

OpenAI並沒有公佈訓練GPT模型所投入的資金。但就深度學習企業Lambda Labs的首席科學家推測,若是利用最便宜的雲端運算服務訓練GPT-3模型,需要花上至少460萬美元、耗時355年才能訓練完成。


ChatGPT有什麼用法

就跟兩年前的GPT-3一樣,除了寫作業、寫程式以外,ChatGPT也有更多元的有趣應用。

我們實際請教ChatGPT「有什麼使用人工智慧產出文字的酷方法」,ChatGPT「稍作思考」後,針對自身的用途,提供寶貴建議,以下為ChatGPT產生的文字:

-生成創意文字:人工智慧演算法可以訓練大量文字,如書籍和詩歌,並可以生成原創的故事或詩歌。

-翻譯語言:人工智慧演算法可以訓練翻譯一種語言到另一種語言,讓不同語言的人更容易溝通。

-摘要文字:人工智慧演算法可以用來自動摘要長文件,讓人們更容易快速理解主要思想。

-寫個人化的電子郵件:人工智慧演算法可以訓練生成個人化的電子郵件,根據人們的興趣和喜好。

-生成新聞文章:人工智慧演算法可以訓練生成特定主題的新聞文章,讓新聞組織能夠快速製作各種主題的內容。

其實,ChatGPT能派上用場的地方遠遠不止如此。它能夠針對使用者提出的決策提供具體建議,例如週末旅遊該去綠島還是台北、明天中午應該出門買午餐還是叫外送等。另外,它也會講笑話、說故事,或是幫助創作者完成對特定要求的描述。

ChatGPT能夠充分理解使用者提出的問題,即使對話時有省略單字例如「出門買」,它也知道那就是買午餐的意思。取自與ChatGPT的實際對話。
ChatGPT能夠充分理解使用者提出的問題,即使對話時有省略單字例如「出門買」,它也知道那就是買午餐的意思。取自與ChatGPT的實際對話。

ChatGPT有何隱憂?

美國已經出現一位哲學系教授發現學生利用ChatGPT交作業的案例,雖然教師憑藉專業和目前ChatGPT行文方式,成功辨別報告不是真人所寫,但教授擔心,隨著機器日益強大,總會有人力無法辨別的一天。

另外,ChatGPT也有被用來生產大量虛假訊息的可能性,因為ChatGPT產出的文字可讀性和邏輯都達到一定標準,若是利用其編造似是而非的內容再到處傳散,很有可能造成社會動盪。為了因應ChatGPT的潛在惡意應用,OpenAI的客座研究員表示,已經在著手研發將浮水印加在ChatGPT產出文字的方法。

除了擔心老師們以後再也無法分辨作業是誰的產出之外,已經出現了人工智慧技術壟斷的相關討論。無論是Google的BERT,或者是OpenAI的GPT,不僅頂尖科學家要投入心血,企業更要挹注大筆資源,才能打造出厲害的模型。

然而,這是個富者愈富、貧者愈貧的世界。隨著大企業開發出一個又一個新的模型,能夠像是這次ChatGPT一樣,從人們的踴躍試用中得到更多回饋,進而改進其模型,而機器學習領域又是一個殘酷的世界,只有表現好的模型才有話語權-這又回頭仰賴企業的資源,因此直到今日,能夠開發出此類巨型語言模型的企業屈指可數。

就像科技作家「演算法決定世界」的預言一樣,人工智慧也把持在少數企業手中。這會為我們的生活帶來什麼樣的影響?是否會出現科幻小說當中的常見情節,日後人類的生活會被少數科技菁英與機器所主宰?我們必須關注人工智慧發展中的壟斷問題。

加入遠見雜誌LINE好友,接收更多好文章!

看更多遠見雜誌文章:
代寫論文ChatGPT,背後OpenAI揭祕
不准抄!OpenAI新招反制ChatGPT代筆
醫療AI好棒棒,為何沒人用?