專訪杜克大學陳怡然:從5G入池看AI發展新方向

編者按:本文來自微信公眾號圖靈教育 (turingbooks) ,36氪經授權發佈。

作為IEEE Circuitd and Systems Magazine的新主編,陳怡然在2020年的第一期雜誌上發表了一篇歡迎詞,表達了他對下一個十年的展望。在他個人微博相關博文的最後一句,他寫道「未來已來」。

陳怡然現任職於美國杜克大學,是電子與計算機工程系的終身教授,杜克大學計算進化智能中心主任,也是美國NSF新型可持續智能計算中心主任。

2019年的聖誕節,陳怡然帶著全家人回到了國內度假。假期間隙,他受邀回到母校,參加了「清華校友學習日」的活動,通過《從神經網絡到專用人工智能》的講座,介紹了當前最先進的技術的發展與變化。

時間回到1994年,那時的通訊專業正是熱門,陳怡然從鄭州一零一中學被保送到了清華大學電子工程系光通信專業,趕上了學校的「4+2」,也就是「拔青苗」培養計畫,六年碩士畢業,畢業時間被提前了一年。

出於個人興趣,也為了和夫人念同一所大學,碩士畢業後陳怡然選擇了去美國普度大學讀微電子方向的博士,並先後進入Synopsys 和Seagate的Advanced Technology Group開始了科研和實驗工作,「我的90多個專利也大多是那個時候發的。」陳怡然說。

幾年後經濟危機席捲美國,實驗室解散,陳怡然選擇進入匹茲堡大學繼續專心做科研。當AI迎風而起時,杜克大學聯繫了當時在做相關領域的陳怡然夫妻,並給出了兩個終身教職作為邀請。這其中杜克看重的,便是其出色的學術實力。

他6次獲得次國際會議最佳論文以及12次最佳論文提名,曾獲得美國國家自然科學基金委教授早期職業發展獎(NSF CAREER)和ACM電子自動化協會新教師獎,出任過多本IEEE和ACM期刊編委,擔任過超過40個國際會議的組織與技術委員會主席和委員。2018年,陳怡然又當選成為IEEE fellow。

壹 擁有新技術,是否還要重複造輪子?

現在,參加會議是陳怡然的日常工作和交流最新技術趨勢的主要途徑之一。隨著過去一年大環境的改變,與之前相比,陳怡然近期回國參會的次數少了很多。

對比國內外會議的關注重點,陳怡然提到了國內獨特的創業環境,還有對於落地的重視:「國內的會議上,幾乎所有人見面的第一個問題都是:AI怎麼去落地?」

在美國,多數大企業在購買新技術後,會有一個公司內部實現轉化和落地的過程。中國的很多企業,包括有些大企業,缺少這一過程,所以投資者在投資時更加看重技術的落地情況,希望「拿來就能用」。也是因為這樣,國內投資聚焦的點多在自然語言處理、醫療或者金融等行業。

「我們國家的比如NLP、醫療和金融領域的技術從產生到落地的賽道很短,美國相對會長一點,這是因為雙方的經濟發展模式與所處階段不同,倒不是誰比誰更高明。」

陳怡然解釋,在美國,很多有技術的小企業不會做到上市這一步,就被大公司收購了。美國大公司的壟斷使得小公司很難真正走到成功,但其雄厚的實力也可以在收購一個小公司後,有足夠的人才和技術保障來吸收新技術,從而順利將其轉化出自己的產品和市場。

在中國,大公司在收購時更希望小公司已經有了自己完整的產品線,產品出來就可以直接開始盈利,「因為很多企業其實沒有足夠的實力來真正消化掉收購的企業」。而如華為等有這個能力的大企業,比起收購,則更願意自主研發。

自然而然,這樣不同的創業環境下,美國與中國的創業公司需要權衡的發展重點也就有一定差異。

「所以美國許多小公司可以只關注技術,做好了自己的部分就賣了盈利。」陳怡然說,「美國許多公司最後是不會走到上市那一步的,他們投入所有精力,生產一個足夠好的零件,就可以賣出漂亮的價格,然後他們可以接著去做其他的技術。」

而對於植根中國的科技創業公司來說,有了足夠創新的「零件」,仍然無法像美國的創業公司一樣。即使是像地平線一樣擁有自己獨特創新技術的公司,也仍需要自主完成一個完整的系統。

「這其實是非常難的。」陳怡然解釋,「一個公司想要證明自己,用在重複造輪子上的時間和精力可能有80%-90%,要遠遠超出真正創新的部分,就是為了證明這個零件是有用的,這個車可以走。對於一個資金和人力都有限的創業公司來說,這是個極大的挑戰,也是導致很多創業公司最終失敗的原因。」

AI芯片公司也面臨著同樣的困難。從芯片研發的角度來說,AI只是其中的一個功能,其他重要的功能還有例如語言、圖像、數據處理等,但是只做好了AI相關的技術還遠遠不夠,「就像上戰場,即使有了新發明的武器,也還需要之前積累的其他裝備來武裝全身,不能只是手裡拿著武器就衝出去了」。

於是在美國的創業公司著重技術更新的時候,許多中國的創業公司把更多的人力與物力投入到了重複造輪子當中。值得注意的是,這樣的差異也使得一些AI技術在兩個國家最後的落地有不同的效果。

目前AI已經在很多生活場景中實現落地,不從事相關領域的人卻沒什麼太大的感覺。「公眾感受不深主要是因為沒有單一產業的形成,落地更多的是嵌在很多已有行業中,造成的影響也就不會像電腦或手機的發明那樣引人矚目。」

貳 衝出「地平線」,在賽道上找準自己的位置

在過去一二十年的時間裡,中美的關係互動已經形成了一個相對固定的趨勢。美國的研發規模與其市場容量存在一定的差異,其本土的市場容量不足以支持所有新技術的落地,技術溢出成為常態。

「也就是說,美國每年可能會產生100種新技術,但其中真正可以在美國本土實現落地的可能只有20種左右,其餘的大部分則需要在海外包括中國等國家落地,投資後的利潤回到美國,來支持下一輪新技術的研發,這樣就形成了一個循環。」

原有的這一循環隨著2019年大環境的改變發生了變化,雙方的協作也在美國技術源頭被打斷後停滯。站在我們的角度看,這種停滯也為國內相關對標企業帶來了新的投資機會。「所以有人問我接下來投資什麼,其實很簡單,照著被禁名單找國內的對標企業就好。」

以地平線為例,2019年2月27日,地平線獲得SK中國、SK Hynix以及數家中國一線汽車集團(與旗下基金)聯合領投的近6億美元的B輪融資,迎來全年高光時刻。經過了這輪融資,地平線公司估值達到30億美金,超越一眾後起之秀,成為了全球估值最高的AI芯片公司,一時風頭無兩。

只是這樣的輝煌沒有持續太久。

作為頭部AI芯片公司,地平線從年中開始,一直持續到年末的「裁員」現象引起了業內不少人的關注。這個現象被不少人工智能從業人員當做了人工智能遭遇拐點的象徵,也有不少人開始提出AI的發展風頭已過,進入了減速帶,甚至冷靜期。在這其中,也有不少對於地平線作為人工智能頭部企業的能力與責任心的質疑。

談到這裡時,陳怡然表示:「地平線現在做的自動駕駛從大的賽道來看是沒問題的。汽車不會被取代,自動化也是板上釘釘的事,賽道本身一定會有人衝出來。只是遇到了整個行業低迷,對於大公司來說,有些事很難避免。」

放眼整個市場,近年汽車行業表現平平,對於這種情況下的裁員,陳怡然表示理解:「想要熬過這段時間順利進入下一程,有些出於防禦的縮減和改變是必須的。」

中美摩擦的時間裡,已經有不少中國相關的對標企業開始拿到一定的投資。國內巨大的應用場景無疑是無可比擬的優勢,在這樣的場景裡,最後一定會有人衝出來。

只是對於大家來說,這樣的市場環境也並不全是優勢。陳怡然認為現階段芯片企業發展受到的衝擊已經很明顯了:「現在存在的最大問題,就是企業不可能在一個不完全開放的環境中取得完全成功。在小範圍關起門來說,照顧對標企業沒問題,這在商業模式下也是可行的。美國有雅虎,中國有搜狐,兩國有鮮明的文化等差異,大家在各自的文化裡都立得住。」

而高科技不一樣,它有著通用的語言和一樣的底層。「可以說大家技術上有時差,有的地方在技術上可能會領先幾年;也有專利壁壘沒法跨越。但是我們之間沒有秘密:你知道的大家都知道,大家知道的你一定也知道,我不相信我們的程序員會不知道世界上其他地方的程序是什麼情況。在這樣的大環境下,企業怎麼可能在封閉的市場裡取得真正的成功呢?不可能的。」陳怡然表示。

短期來看,在企業處於沒有成熟的萌芽階段,適當的保護和資源優勢可以提供一個相對穩定的發展環境;放眼長遠,在面對全世界的市場時,本地企業總是需要和國外企業一同競爭後才能分出輸贏。

「國內多支持地平線沒有問題,但是如果關起門來只用地平線,一旦開放,和Mobileye、特斯拉等公司碰上,就很容易被國外企業摧枯拉朽競爭掉,長期來看,最好還是可以和不同的企業掰掰腕子。」陳怡然補充道,「當然,國家對特定產業的保護是另一個問題。」

國內AI芯片發展的另一個問題涉及到摩爾定律,也就是芯片的發展週期沒有滾動起來。不少公司在不斷推出新的芯片後,產品會得到不錯的口碑,但最後並沒有真正實現落地,也就沒有掙到足夠的資金投入下一代芯片。

在過去的三十年,摩爾定律每年都在被質疑,但它一直都在往下走,以不同的形式出現。談到摩爾定律對於芯片及芯片公司發展的影響,陳怡然說:「芯片是個很古老的行業,我們在這個行業的主要困難就是被人在技術上卡脖子。AI芯片的週期很有趣,它是個不斷迭代的過程:一個芯片的生命週期大概是2-3年,也就是24到36個月,其中真正掙錢的只有12-18個月,後期基本就是維持消逝。」

在盈利的12-18個月中,芯片需要掙到足夠的錢支持完成下一輪的迭代。想要跟上發展的關鍵,就是讓芯片發展的週期從頭到尾完整起來。

「迫於市場競爭壓力,即使沒有從上一輪芯片獲得足夠的利潤,許多公司仍會投資新的芯片,成了靠燒錢推動進程,就好像一個完整的環,現在我們只有一半,另一半還沒有。」陳怡然告訴圖靈訪談,「這也是很多小公司無法走到最後的原因,還沒有完成這個週期,就已經撐不住了。芯片的發展最後一定是小的被大的吃掉,大家合併成幾個大的公司。」

同時陳怡然表示,對於新技術從算法到實際應用的過程中簡化落地週期而言,AI芯片並不是一個技術能否落地的決定因素。「它的作用是間接的,並不能被當做『殺手鐧』,更像錦上添花。」陳怡然舉例:「一個要用5年實現的技術,有了AI芯片的加持,可能3年就能實現。」

其他影響AI落地的因素還有數據的獲取、模型的建立和訓練以及系統成本。在這些成本中,AI芯片佔的比例只是很少一部分,而且不是決定的部分。其他更多的非技術因素也會影響AI的落地情況,「就像幾十年以前,我們告訴紡織工人有了紡織機他們就不用再工作了,他們也不會支持紡織機進入工廠」。一旦涉及到人,情況就複雜了很多,需要好好推敲。

談到大家對於AI相關產業的追捧,陳怡然說:「掀起AI芯片大熱和前所未有發展大浪的,更多的是國內微電子的大熱與實現彎道超車的需要。」而這樣的需要也導致了不少算法研究人員更重視刷榜,而不是投入實現落地的現象。

「亞洲人在世界AI領域的話語權整體上不高,大家很難進入核心委員會,即使是在美國的華人學者也會面臨這樣的問題,刷榜也可以作為一種發聲方式吧。」陳怡然說,「這樣的現象正在改變,只是很慢,還需要時間。」

「企業也很明白這一點,所以會在刷榜和落地上找到自己的平衡,這與企業所處的階段也有很大關係,例如在融資階段時,一個漂亮的排名可能就會起到用處。」

無論是中國還是美國企業,實力是提升在國際上的話語權的根本。作為提升企業實力的重要手段,邀請高校教師加入都是很普遍的現象。

「現在國內很多企業招收的知名學者已經很多了,當然與谷歌這樣的公司比還是有一定差距。站在我的角度看,學者進入工業界確實會有很多問題,並不是說挖了就一定能成功,關鍵在於怎麼用這些老師。」

舉例來說,國內的工程師比較擅長頻繁試錯,不斷成長,試錯成本相對較低,所以可以做到快速迭代成長。相比之下,老師擅長的是高瞻遠矚和確定方向,所以還是要配執行力強的人,讓老師做該做的事情。

「老師的優勢是號召力強,一個優秀老師的到來可以帶來很多人才,這樣後續人才儲備就跟得好。換個角度,如果只是一味要求老師提升KPI就不太行,因為他接受的訓練就不是干這個的。」

參 實現自動化,讓芯片研發過程無人值守

想要讓算法的研究更加貼合實際應用,算法研究員和芯片研究員都需要向實際應用靠攏。「不能兩邊各幹各的。」陳怡然說。

為了更好地實現這一點,整個過程的自動化成為了一個大趨勢。

「系統根據數據找到最切合的模型,訓練出來滿足要求,根據模型再設計最切合的硬件,有效地去做計算。有了標註好的數據、模型和硬件,中間不需要人管,就可以實現end to end。這一過程中,從拿到數據到發現最優神經架構搜索,再到找到最好的神經網絡,中間完成匹配全部是自動優化出來的結果。」陳怡然解釋道。

實際上,這個過程中每個單獨的點現在都已經完成了,比如拿到數據、發現最優神經網絡架構和硬件匹配,現在的工作就是將各個點之間連起來,形成一個整體。

這是美國現在在做的工作,也是未來兩三年不可小視的工作重點——實現在無人值守的狀態下自動完成從數據進來到最終芯片出來的一系列的工作。「因為在實際落地過程中,我們得到的往往只是一個要求和相關數據,最終達到一定正確率即可,客戶是不會管中間過程的。」

美國不少機構在這方面已經取得了一定的成果,國內如清華大學、中科院計算所等機構在大公司的支持下,也逐漸取得了進展。陳怡然預測這一趨勢的落地會非常快,「也許在近兩三年之內就會在嵌入式等一定簡單的應用上實現落地」。

肆 5G入池,激起行業發展新趨勢

作為合格的芯片,不論要應用於哪個行業,其製造都需要滿足兩種要求:效率與成本。在大的要求下,AI芯片的計算功耗效率和計算效率需要提升,單位成本則需要降低。

「在國內,大家的支付意願更偏向數據中心,而不是IoT。」市場中不同行業的支付意願也是不同的。

一般來說,對算力要求比較高,又願意付錢的行業大致可以分為兩種,其中一種是一旦提高對於算力的要求,獲得的利潤也成倍增長的行業。

陳怡然舉例:「比如阿里巴巴和京東的推薦系統,當精確度從99%提升到99.9%的時候,創造的成交收益可能就會增加幾千萬甚至上億。這對於購物網站來說是非常重要的。在醫療方面也是一樣,死亡率上的一個小改變,對於最後結果的百分比都很關鍵。」

另外一種則是如IoT指數增長。「比如在移動端上,今年我在移動設備上佈一百萬個點,明年布一千萬個,最後實現每個設備都有點,這種情況下大家的支付意願也很高。」

在這其中,陳怡然關注的是IoT+5G,做支撐的是他的一個理論:一條認知曲線看似是線條的起伏波動,但實際上要更複雜,每個上升或下降的過程中都有其他細小的趨勢改變。

不同的技術不停插進來,也就使得這條曲線不停產生新的波動。「就像往池子裡扔個石子,會激起一圈一圈的水紋,漣漪從大到小一圈圈擴開。當同時扔兩個石子進去的時候,就會匯合會形成更大的波。」陳怡然解釋。

AI的第一個波已經過去,5G的到來無疑是第二顆石子,會激起更大的波。「5G是一個大家容易關注到的點,即使不是百分之百確認這個技術會帶來怎樣的變化,相關方向的努力也是合理的。5G的設計本身就是為了IoT,如果真的可以像承諾的那樣發展,AI一定會順勢而起。美國現在很火的AIoT(智能物聯網),就是計算資源下沉到端。」

所有做雲的企業,比如亞馬遜和谷歌,都一定會搶端,即使賺錢的部分是雲。目前阿里和華為也在做著相似的工作,努力卡住端上的數據。為了應對5G的投入,行業內的各個公司都在為之做著準備。

進入2020年後,陳怡然的工作也開始圍繞著新的環境和5G到來展開。「目前我的研究重點更偏向深度學習加速,我不是應用的專家,也不做基礎算法,而是更偏向做計算,給我一個算法我會研究怎樣做得更快,用時更少。」

本文經授權發布,不代表36氪立場。
如若轉載請註明出處。來源出處:36氪