人工智能專家:AI並不像你想像的那麼先進

人工智能專家:AI並不像你想像的那麼先進
人工智能專家:AI並不像你想像的那麼先進

梅勒妮·米切爾(Melanie Mitchell)寫了她的新書《人工智能:思考人類的指南》(Artificial Intelligence: A Guide for Thinking Humans),因為她對人工智能究竟取得了多大進步感到困惑。她寫道,她想“瞭解事情的真實狀態”。

得知她的矛盾心理是一種安慰,因為她自己就是一名人工智能研究員。她是波特蘭州立大學的計算機科學教授,也是著名的多學科研究中心聖達菲研究所(Santa Fe Institute)科學委員會的聯合主席。如果米切爾對人工智能的立場都感到困惑,請原諒我們其他人的困惑,或者是謬誤百出的見解。

正如米切爾所指出的那樣,許多有關人工智能勝利的故事正在流傳。這些報告中,最近在計算機視覺、語音識別、遊戲和機器學習的其他方面的突破表明,人工智能可能會在未來幾十年很大範圍的任務中超越人類的能力。有些人覺得前景不可思議;另一些人擔心“超人類”計算機可能會判定不需要我們人類在身邊,並有能力做些與此有關的事。

我們要麼離‘真正的’人工智能只有咫尺之遙,要麼離了數百年。”

但也如米切爾另外證明的那樣,即使是當今最強大的人工智能系統也有關鍵性的侷限。它們只擅長於狹隘定義的任務,對外面的世界一無所知;它們在數據中發現相關性,而不考慮數據的含義,因此他們的預測可能是非常不可靠的;它們沒有常識。

“要麼取得了巨大的進展,要麼幾乎沒有進展,”米切爾寫道。“我們要麼離‘真正的’人工智能只有咫尺之遙,要麼離了數百年。”

米切爾解決問題的方法使這本書具有紀念意義和啟發性。她對當今人工智能技術的耐心解釋給人的印象是,真正的機器智能還很遙遠。她表示,電腦不僅需要更好的大腦,還可能需要更好的身體。

米切爾提供了非常清晰易讀的人工神經網絡入門知識,該技術是圖象識別,語言翻譯和自動駕駛方面最新進展的核心。20世紀50年代和60年代,在最初的一些建立人工智能的嘗試中使用了神經網絡,但它們失寵了,因為看起來像一條死胡同,價值有限。但大約10年前有所改變,計算能力的進步使一種稱為深度學習的數據密集型方法來訓練神經網絡成為可能。

跟隨米切爾對神經網絡的描述,你不需要瞭解繁雜的的數學。她展示了數學主要是什麼,這就同時解釋了它們的威力和缺陷。一種對識別圖象內容特別有用的神經網絡依賴於一種叫做“卷積”(convolution)的數學計算。處理文本的版本依賴於計算機表示語言統計方面的能力,即在穿過數百個維度的複雜“向量”裡,單詞在句子中出現的頻率有多高。

令人印象深刻的是,人們已經將世界上如此多的方面進行了量化,以供計算機繼續工作。同樣值得注意的是,這些方法有如此多樣的應用,比如檢測腫瘤、自動駕駛和過濾垃圾郵件。但是這種偉大計算器的巧妙新用途並不一定賦予它們與我們的智力相當的能力。正如米切爾所指出的,讓卷積神經網絡(Convolutional Neural Networks, CNN)正常工作“需要大量的人類智慧”。

機器學習系統本質上是統計工作,所以很清楚,為什麼它們很容易受到所饋送數據中的不準確、漏洞和其他缺點的影響。難怪如果神經網絡在主要顯示白人的圖象上經過訓練,它就不能識別黑人的臉。當一輛自動駕駛汽車無法識別一個有貼紙的停車標誌,但(對人類來說)它仍然是一個明顯的停車標誌時,就並不奇怪。

幸運的是,這類問題已經引發了許多富有成果的討論,這些討論關於面部識別技術和自動決策的社會影響。紐約大學數據新聞學副教授梅雷迪思·布魯薩德(Meredith Broussard)在2018年出版的《人工智能:計算機如何誤解世界》(Artificial Unintelligence: How Computers The World)一書中有說服力地提出,無論你是否稱它為“人工智能”,計算機仍然應該被當作是被我們這些好奇的人類使用的工具,人類應該始終處於這個範圍內。

不過,儘管米歇爾並不是第一個指出機器學習系統弱點的人,她還是在評論中加了一層解釋說,即使在它們處於最佳狀態的時候,計算機可能也沒有你想的那麼好。在過去幾年裡,研究人員開發出了神經網絡,他們聲稱,在識別照片或視頻中的物體時,神經網絡的表現達到甚至超過了人類的表現。這在新聞中被作為另一個必然對機器優勢“抵抗無果”的例子。

米切爾指出,討論的基準是一個基於名為ImageNet的大型圖片數據庫的測試。2017年,最優秀的計算機系統對來自ImageNet的圖片進行了分類,正確率達98%的top-5正確率,據稱超過了95%的人類正確率。(註:top-5準確率指排名前五的類別包含實際結果的準確率,即對一個圖片,如果概率前五中包含正確答案,即認為正確。)

“top-5”的障礙是什麼?這意味著正確的物體分類是機器作出的前五種猜測之一。米切爾寫道:“如果給定一個籃球的圖象,機器按這個順序輸出‘槌球’、‘比基尼’、‘疣豬’、‘籃球’和‘搬運車’,就被認為是正確的。top-5指標存在的原因可以理解:如果一張圖片顯示了不止一個物體,那麼瞭解機器是否能檢測出這些物體是很有用的。但它削弱了對極端技能的要求。米切爾表示,2017年,當該機器將正確的類別歸置在其列表首位時,top-1的最高準確率僅為82%。(註:top-1準確率是指排名第一的類別與實際結果相符的準確率,即對一個圖片,如果概率最大的是正確答案,才認為正確。)

至於說人類有95%的準確率,米切爾認為支持這一說法的數據站不住腳。在2015年發表的一個研究項目中,兩個人嘗試了ImageNet挑戰的一部分。投入更多時間的人是安德烈·卡帕西(Andrej Karpathy),他現在是特斯拉的人工智能主管。以top-5準確率作為衡量標準,他錯了5%。而現在,這個數字被用作人類表現的標準。

如果不是因為這個特殊測試的古怪之處,他的錯誤率可能會更低。卡帕西寫道,他和另一名測試對象所犯錯誤的四分之一,不是因為他們對所看到的圖片一無所知,而是因為他們不知道或不記得ImageNet中使用的一些確切的標籤。

更糟糕的是,“據我所知,還沒有人報導過機器和人類在top-1準確率上的比較,”米切爾寫道。

憑藉其快速和無盡的耐心,計算機是許多應用中圖象識別的理想選擇。在某些情況下,它們肯定比人類更準確。但說得太過了。“物體識別尚未接近被人工智能‘解決’的程度,”米切爾寫道。

我很難想像我們需要什麼樣的突破才能製造出這樣一台機器。”

人工智能目前最熱門的話題之一是,如何讓機器不僅檢測數據中的統計相關性,而且在某種程度上理解它們正在處理的內容的意義。和米切爾一樣,紐約大學的研究人員加里·馬庫斯(Gary Marcus)和歐內斯特·戴維斯(Ernest Davis)表示,如果沒有這些改進,人工智能就不會“安全、智能或可靠”。在他們的新書《重啟AI:構建我們可以信任的人工智能》(Rebooting A.I.:Building Artificial Intelligence We Can Trust)中,馬庫斯和戴維斯說,人們由於“可信度差距”而誤以為計算機比它們更先進。

他們寫道:“我們不得不從認知的角度來思考機器(‘它認為我刪除了我的文件’),不管機器實際上可能遵循的規則多麼簡單。”

為了讓機器變得不那麼簡單,許多研究人員正在重新探索用邏輯和常識來編碼計算機的舊方法。以米切爾為例,她用類比的方式描述了她讓計算機進行推理所做的努力。如果你想要一個電腦識別圖象描繪“遛狗”,現在的基本方法是給它顯示成千上萬的遛狗的圖片,然後使之相信那些照片中常見的事物——狗,皮帶,手等。當機器看到之後遛狗的照片時,將觸發一個積極的信號。然而,它可能會嗅出一些不尋常的遛狗行為。米切爾展示了一些例子,比如一張照片,一個人騎著自行車遛狗,另一隻狗叼著另一隻狗的皮帶。她的研究小組正試圖讓計算機理解後一種情況是典型情況的“延伸”版本。

那樣的工作是辛苦而緩慢的。即使它成功了——如果一台電腦可以在某種程度上理解“遛狗”可以有多種形式——如果這台機器自己從來沒有遇到過狗,這種理解能有多豐富呢?

當我6歲左右的時候,我在我家附近的人行道上騎自行車,停下來看(也許還扔了) 一串從甜膠樹上摘下來的帶刺的種子球。突然,有人打開了街對面一所房子旁邊的一扇門,出來一條棕色的狗,它猶豫了一兩秒鐘,然後徑直撲過來,咬住我,撕破了我的燈芯絨褲子。這些記憶幫助我洞察到經歷的無數方面——驚訝、恐懼和痛苦的感覺;一些狗的不可預測性;甜膠種子球的奇異古怪。相比之下,如果計算機被告知當人們說“something bit them in the ass”時並不總是一個習語,那就太膚淺了。(註:bite本意為“咬“,ass本意為“屁股”,bite (someone) in the ass指不當行為導致了不良後果。)

哲學家和其他人工智能懷疑論者一直認為,沒有真實身體的電子大腦只能學到盒子裡這點東西。許多人工智能研究人員將這種懷疑歸咎於“某種殘留的神秘主義”——正如認知科學家安迪·克拉克(Andy Clark)在1997年出版的《此在:重整大腦、身體和世界》(Being There: put Brain, Body, and World Together Again)一書中所寫的那樣,這是一種“對類似靈魂的精神實質的非科學信仰”。但是,當你考慮到爬行的嬰兒能快速掌握基本概念,而數據中心的計算機需要大量的電力來吸收一個東西時,人工智能需要一個身體的這個想法就聽起來相當不錯。

米切爾似乎不情願地轉變為懷疑論者的立場。“在與人工智能搏鬥多年之後,我發現關於身體化的爭論越來越有說服力,”她寫道。

那麼,怎樣才能製造出一個能在世界各地移動的機器人呢?這個機器人不僅能洞察自己的行為,還能洞察人類、動物和其他機器的行為。“我幾乎無法想像,”她寫道,“我們需要什麼樣的突破才能製造出這樣一台機器。”

本文經授權發布,不代表36氪立場。

如若轉載請註明出處。來源出處:36氪