AI 時代下,哪一種人可能會失業?專家解析深度學習、未來人才的必備能力

現在如果想知道未來一周的天氣、接下來自己有哪些行程,只要對著手機說一聲「Hey!Siri!」「OK!Google」就能啟動語音助理,讓他們來告訴你。至於未來會不會出現像電影《雲端情人》(Her)中,那位善解人意、能和主角交心的女聲,似乎也沒那麼難以想像。

這些年來,各式各樣新興科技陸續進入我們的視野,人工智慧(AI,artificial intelligence)、區塊鏈(blockchain)等等,雖然我們不一定了解這些技術的原理,但它們確實加速了許多領域的發展。然而在這些科技的背後,其實還有一項可以視為推手、多數人卻相對陌生的技術:機器學習(machine learning)。

「機器懂得學習,才有辦法成為人工智慧。」台灣大學電機工程學系助理教授李宏毅說,這個概念其實並不新穎,早在 1980 年代,就有人構思出來。但一直到近幾年,受惠於現代技術的演算能力,人類才終於能發揮這項技術的潛力,得以把機器的能力再往前推一步。

機器學習技術的應用,其實非常貼近我們的生活。例如語音助理之所以能辨識我們在說什麼,正是因為它們不斷學習「聽懂」我們說的話。

讓機器「自行」摸索規則,處理更複雜的問題

然而,為什麼機器需要懂得學習呢?最簡單的答案,就是它們能解決更複雜的問題。李宏毅解釋,過去工程師通常是寫了一套規則,當機器遇到特定情況時,會參考這些規則,決定它們要做出哪些反應。

可是,當我們希望機器可以處理更多的事情時,想要寫出所有的規則並不實際。他同樣以語音辨識的技術為例,假設我們希望語音助理能聽得懂「今天下午的天氣如何?」應該是請人錄製一段音源,並告訴助理說,這樣的音源可以轉換為以上的文字。

但這時候會碰到一個瓶頸:每個人講出這句話的音調、咬字和語氣都不太一樣,難道工程師要蒐集所有講中文的人,錄下這句話的聲音再寫下規則嗎?因此,類似這種規則難以窮盡,或是不容易訂出規則的領域,靠著傳統方法,必然有其局限。

所以,與其試圖寫出所有的規則,不如讓機器「自行」摸索出規則,這正是機器學習最基本的概念。也就是說,替機器整理好數據,並告知這些資料背後的涵義,經由演算、歸納之後,它們就學習到一套邏輯與分析的方法。

舉例來說,如果我們希望機器能夠分辨出,哪些照片中有貓,就要先彙整非常多貓的照片,並告訴機器說這些照片裡有貓,包含貓有哪些特徵,像是尖耳朵、鬍鬚等。當這些資料經由機器演算之後,便能訓練它們一旦辨識到特定元素,就能判定照片裡有一隻貓。

此外,具備機器學習能力的影像辨識系統,也因此能夠應用在更廣的領域,像是腫瘤、心臟超音波、視網膜等醫學影像,可望降低醫生繁重的作業,更有效率地判讀這些病變。

在影像之外,應用到機器學習的場景其實也很廣泛,像是你的 email 信箱,知道哪些是垃圾郵件;影音平台總是能推薦你有興趣的影片,都是系統逐漸學習而來的邏輯。而在未來,自動駕駛要判斷路況,或更懂你的智慧家電,都會運用到這項技術。

不過,傳統機器學習更像是協助人類記憶、分類的工具,要透過機器學習做出更貼近想像的人工智慧,得更進一步探究「深度學習」(deep learning)的領域。李宏毅比喻,「機器學習」就像是只有一層神經元的人腦,「深度學習」則是增加了很多神經元,因此才能做到自行學習、判斷特徵,並形成自己的邏輯

同樣是判斷照片裡有沒有貓,傳統機器學習仰賴人類先訂好規則,告訴它要抽取那些特徵,但深度學習只要給予足夠照片,就能不斷拆解照片中的圖形,並把相似者分為一類,最後摸索出「貓是什麼模樣的動物」,自行歸納出貓的特徵,用類似人類學習的過程,掌握分類的原則。

當機器能自主學習,工程師反而是容易被淘汰的一群人

不過當機器的能力愈來愈強大時,又會衍生出另外一個問題:機器是否會取代人類?這的確是許多工作者擔憂的議題。

但李宏毅並沒有悲觀認為人力會百分之百被取代,而是會以新的工作模式出現在職場中:人機共事,也就是透過機器先做好初步的工作,碰到無法處理或難以判斷的困難時,再由人類接手。

舉例來說,客戶服務就是一個好的切入點,先由能做到深度學習、了解客戶語意的聊天機器人,處理較為簡單的問題,像是基本規範、操作流程等已經設定好的答案,但當機器人遇到客戶十分個人化的問題時,就會由真實的客服人員協助處理。人機合作的工作方式,有助於降低人力,也能減少每位客服人員應付零碎問題的頻率。

從李宏毅的說法來看,

會不會寫程式,並不是決定工作者未來能否存活的關鍵。原因是機器學習不是只要工程師就夠,尤其當機器能自主學習,不再需要那麼多人替它撰寫規則,工程師反而容易被淘汰。

事實上,機器學習或深度學習,只是一種手段,仍然要有人來制定目標,決定它應該要做到什麼,並且進一步思考如何設計機器的「腦袋」以及「學習方式」,還要替機器蒐集適合的資料。

李宏毅就提到 Google 一個有趣的例子,Google 為了要訓練自己的語音辨識系統,他們曾經找尋專門錄音的公司,提供機器學習的素材。然而,後來他們發現自家產品 YouTube 更有效率,原因是許多人會在 YouTube 上傳有字幕的影片,便成了現成的資料來源,也不需額外花錢請人錄音。

這代表要做好一項機器學習的產品,開發的能力固然重要,但能夠發想、設計更有效率的「教材」的人才同樣必要。而走到應用端,如同能夠和機器共事的客服一樣,了解機器的極限,並懂得在適當時機介入,也會是未來需要的人才

不怕試錯、擁抱新知識,是未來工作者最應具備的態度

既然機器學習同時帶來希望與人力可能被取代的危機,想要利用這項技術的組織或企業主,應該做好哪些準備?李宏毅提點兩個方向。

首先,必須確實了解機器學習需要哪些資源。舉例來說,剛起步的電商網站想要組織機器學習的團隊,負責設計商品推薦系統。然而機器學習在客戶資料還沒有齊全的狀況下,不可能憑空摸索與建立推薦的規則。

再來,李宏毅坦承,通常難以預測機器是否真的學到你需要的規則,因此組織必須留下更多時間,檢驗原先蒐集的資料與學習的方式。

他比喻,這就像主管帶新人一樣,不可能有完美的管理方法,適用於每一位下屬,勢必會有一段磨合期,找到最好的相處方式。李宏毅強調,通常不會第一次就找到正確的組合,這也延伸到工作者身處機器學習的時代,同樣要具備敢於承認與面對錯誤的心態。

最後,問到在研究機器學習領域的過程中,對於自身有沒有哪些幫助,李宏毅表示,因為機器跟人類學習的邏輯,還是有很多差距,在「學習方法」這件事情上,並沒有任何的參考價值,但在「學習態度」上,卻對他有很大的啟發。

「我在 2015 年開設深度學習的課程內容,和 2018 年就已經非常不一樣。」他說,雖然第一堂的簡報內容,都是由「為什麼深度學習,會比其他學習技術還要好?」開場,但 3 年前這個問題的答案,還停留在猜測的階段,但數據、實驗現在已經可以證明,深度學習在辨識、分類上的精準度確實更高。

因此,這兩項技術帶給他最多的收穫,就是保持不斷學習的態度。他笑著說,這個領域的更新速度,其實是以「月」為單位,或許這個月還在使用的設計方式,下個月就會出現更實用的解法。這也是他提醒工作者最後一件事情,唯有抱持開放的心胸,以及好奇的態度,才是未來具備競爭力的不二法門

傳統寫程式 vs.機器深度學習:大數據分析、資訊產製更精確

機器學習和深度學習,相較過去電腦、程式執行任務時有非常顯著的差異,它們會更有效率、聰明地掌握與拆解大量的資料。以下用李宏毅在課堂中,請學生透過深度學習的方法,繪製出指定特徵的漫畫角色為例:

傳統寫程式

經理人月刊第 167 期

過去想要做到影像辨識,必須把所有符合條件的特徵,都寫成規則給電腦或程式。然而,光是「笑臉」,人可能就有千萬種笑法,代表工程師得把全部的笑臉寫入規則中。

機器深度學習

經理人月刊第 167 期

  1. 蒐集資料:盡可能蒐集漫畫角色的照片,愈多愈好,充足機器學習的教材。

  2. 交由機器分析:它會分析、歸納各種照片的特徵,像是分出長髮、短髮或是各種髮色。

  3. 結果檢測:指定條件:短髮、紅髮、笑臉。機器就可以自動組合出正確的樣貌。

機器了解這些特徵分別對應什麼樣的圖像時,便能自動產製出符合條件的角色圖像。

李宏毅

台灣大學電信工程學博士畢業,現為台灣大學電機工程學系助理教授。曾擔任中央研究院研究員,並受邀前往麻省理工學院的電腦科學暨人工智慧實驗室(CSAIL),擔任客座科學家。主要研究領域為機器學習、深度學習,讓人工智慧聽得懂人說話。

延伸閱讀 \