機器人、自動駕駛、超算中心......從特斯拉AI Day一窺馬斯克的野心

本文來自微信公眾號 “汽車之心”(ID:Auto-Bit),作者:鄭森鴻 田溪,36氪經授權發佈。

特斯拉 AI Day 終於來了。 馬斯克這次帶來了三路人馬,分別來自  人形機器人 Optimus  、  Autopilot  以及  超算 DOJO   團隊,浩浩蕩蕩到一度在演講台前面擠不下。

最先亮相的是 Optimus,它除了能夠自由行走,也能抓取、搬動一些小型物體。

此外,搭配運用在特斯拉汽車上的同款 FSD 電腦,Optimus 也擁有了一定程度的人工智慧。馬斯克介紹,這款機器人即將投入生產使用,未來產量有望突破數百萬,價格將降至 2 萬美元以下

自動駕駛技術分享一直是特斯拉 AI Day 的重磅欄目,這一次 Autopilot 團隊帶來了新的玩法:將佔用網路(Occupancy)引入到自動駕駛中,將現實世界對應到向量空間,實現更好體驗的車輛規劃。

與此同時,「資料驅動」也被特斯拉玩出新高度,在 30PB 的資料積累下,每 8 分鐘就能訓練一個模型。

如今,FSD Beta 已迭代到 10.69.2.2 版本,測試人數來到 16 萬。

按照馬斯克新立下的 FLAG,今年底將向全球開放。

另一邊,超算 DOJO 也傳來好消息。不僅提供超高算力,還擁有比肩輝達的頻寬、減少延遲、節省成本等優勢。據瞭解,特斯拉將於 2023 年第一季度在美國帕洛阿爾托完成七台 EXA POD 的建設。

尤為值得一提的是,如今 AI Day 也成了特斯拉的招聘宣講會,馬斯克在會上多次表示希望吸引有才能的人加入,「矽谷那些大公司可能會辜負你,但特斯拉不會,在這裡,你會享受到未曾想像的自由。」

「佔用網路」被特斯拉引入自動駕駛

FSD Beta 測試人數已達 16 萬人

在本屆 AI Day 上,最新亮相的特斯拉人形機器人 Optimus 無疑吸引了大量目光。

就連 Autopilot 負責人 Ashok 在接棒該部分之後的演講時,也不免捏了汗,自嘲道:「我儘量做到不冷場。」

儘管如此,無論從時間篇幅,還是從演講人數上來說,自動駕駛仍是這次盛會的重頭戲。與前幾屆 AI Day 側重感知技術突破交流不同,這次的分享更多聚焦在規劃/「Planning」上面。

Ashok 用上面這張框圖基本概括了這次 AI Day 上有關自動駕駛的主要內容,可以看到:

左邊的訓練基礎設施(Training Infra)和右邊的 AI 編譯器&推理引擎(AI Compiler& Inference),以及下方的訓練資料(Training Data),共同輸入資訊進入神經網路(Neutral Networks)中,對佔用網路(Occupancy)和一些幾何形狀(Lanes and Objects)進行分析,最後整體輸出結果,生成自動駕駛車輛的路徑規劃。

以一個十字路口的通行交通流為例,當前車輛處於待左轉進東西方向車道的位置,而對向有行人橫穿馬路,待轉入的車道也有川流不息的車流,這時自動駕駛車輛該如何通過?

從策略上來說,先讓行車流,待行人走遠後再通行,無疑是最優選擇,然而這看似平常的操作,對於僅依賴 8 顆攝影機做感知的特斯拉來說,卻沒有那麼簡單。

這裡面涉及許多物體(包括人)之間相互關聯的判斷,以及智能汽車應該如何作規劃協調。

特斯拉的做法是首先通過 8 個攝影機的視訊流,形成一個基於 3D 定位的「可見空間」,即所謂的佔用網路區域

該區域將掃描到的物體邊緣用方塊顯示,類似《我的世界》遊戲中對於各類建築物的網格化描述,並渲染到向量空間,以此來呈現現實世界。

與此同時,也有一些攝影機覆蓋不到的地方,例如被遮擋的障礙物。這時,特斯拉 FSD 能夠通過 AI 編譯器&推理引擎,預測可能有路緣、道路上各種標線等等。

更值得一提的是,對於車輛或者人,特斯拉還考慮到他們的運動學狀態,比如說速度和加速度,來進行多模態的預測。這相對傳統的目標檢測網路來說非常複雜,後者完全不可實現。

自動駕駛離不開資料的「喂養」。

對應到特斯拉的訓練資料上,分為三個部分:自動標註(Auto Labeling)、模擬 (Simulation)、資料引擎(Data Engine)。

據 Autopilot 團隊成員介紹,特斯拉積累了海量的視訊片段,其中的資料達 30PB,需要 10 萬個 GPU 同時工作 1 小時才能處理完。

要對這些片段進行訓練,需要一個強大的標註網路,不僅需要效率足夠高,還要能滿足和人類標註一樣的高品質、多樣性以及擴展性要求。

對此,特斯拉採用「人機合作」的方式,既使用人力標註,也採用自動標註。

不過 Autopilot 團隊正在加強自動標註的能力,例如與佔用網路相結合,與運動學資訊結合,讓 FSD 變得更加智能和高效。

「我們可能需要 10 萬個片段進行標註來訓練 FSD,這真的像專門的標註工廠,可以讓我們的技術基礎更紮實。」

現實世界收集到的資料不足以覆蓋所有場景,要完善 FSD 的功能,還需要做模擬模擬。

Autopilot 團隊成員介紹,目前特斯拉僅用 5 分鐘時間,就可以生成與現實世界非常接近的虛擬場景,他還以舊金山街道地圖為例,包括地面標線、行人車輛、訊號燈,甚至樹木樹葉也能隨時換景。

此外,針對城市、郊區、農村不同地區,也能建立十分逼真的道路場景。而如果由人工來繪製設計,或許需要一兩週甚至幾個月時間。

資料引擎也是本屆 AI Day 上自動駕駛技術的一大亮點。

按照 Autopilot 成員 Kate Park 的說法,資料引擎是將通過將資料輸入到神經網路,提高確定性,以更好地去解決現實世界的預測問題。

她引入了一個如何判斷交叉路口轉彎處的車輛是否停止的問題:如果車輛在拐彎的地方速度降低,該如何應對,能否判定為停車。

對此,特斯拉建立了許多網路進行評估,針對這一問題收集了 1.4 萬個類似的視訊,或來自當前車隊,或來自模擬模擬,新增到訓練集中,以幫助自動駕駛車輛做更好的預測和判斷。

從其演示的視訊中可以看到,特斯拉用不同顏色標註了不同轉彎處的車輛行駛情況。「紅色或許意味著是處於停止狀態,從結果來看,我們當前判斷已經不錯了。」

事實上,以上所有這些功能都已在特斯拉最新的 FSD Beta 10.69.2.2 上推送。據瞭解,目前特斯拉 FSD Beta 的測試人數已經擴充到 16 萬人,而在去年這一資料還僅為 2000 人。

Ashok 表示,特斯拉持續一年,以 7 天訓練 75,000 個神經網路模型的節奏推進研發,基本上相當於每 8 分鐘就訓練了一個模型。

與此同時,馬斯克也透露,按照這樣的速度,特斯拉可以在 2022 年年底向不限於美國和加拿大在內的全球推出 FSD。

「我們在技術層面已經做好了,可以適應任一國家的不同的路況。」至於監管審批上的問題,特斯拉也正在和各地保持密切溝通。

按照馬斯克此前的描述,FSD 的測試人群將在今年年底擴大至  100 萬人  。

DOJO 蓄勢待發,降本增效打輝達

作為特斯拉雲端訓練的超級電腦,DOJO 無疑是特斯拉 AI DAY 的壓軸大作。

馬斯克曾在 2019 年首次提到 DOJO 的概念:

DOJO 是性能野獸,能夠處理海量的資料,用於「無人監管」式的標註和訓練,相當於是無需人工對訓練資料集進行標註,系統能夠自行通過樣本間的統計規模對樣本集進行分析,進而提高效率。

言外之意,DOJO 的使命是如何用最高的效率,訓練特斯拉的純視覺自動駕駛。

在去年特斯拉 AI Day 和 Hot Chips 34 會議上,特斯拉先後披露了 DOJO 的架構、細節參數,包括建立主機 CPU 與訓練處理之間橋樑的介面處理器(DIP),以及 AI 算力高達 362TFLOPs 的 D1 晶片等等。

時隔一年,特斯拉不僅帶來更具有象徵意義的研究成果,並計畫在 2023 年第一季度正式量產DOJO EXA POD

特斯拉 Autopilot 硬體工程副總裁 Pete Bannon 表示,DOJO 相較於去年的工作測試,今年的進度主要在於 DOJO 背後如何將晶片組成、以及更加高效的編譯。

省時省力省成本省空間」,EXA POD 的出現便是遵循了馬斯克強調的第一性原理。

什麼是 EXA PDO

簡單來說,如果將 DOJO 視為一個超算叢集,那麼 EXA POD 可以視為這個叢集當中的一組成員。

一個 EXA POD 將由兩層計算托盤和儲存系統組成,每一層托盤包括 6 顆 D1 晶片、20 個介面處理器,包含 1.3TB 的高速 SRAM、13TB 的高頻寬 DRAM,以及 1.1 EFLOP 的算力。

除此之外,為瞭解決 EXA POD 極限的高整合度帶來的熱膨脹係數(CET)問題,特斯拉曾在 24 個月內迭代了 14 個版本,最終採用了自研的電壓調節模組(VRM),降低了超過 50% 的 CTE,並擴大 3 倍以上的性能指標。

特斯拉工程師表示,EXA POD 在具有人工智慧訓練超高算力的同時,擁有擴展頻寬、減少延遲、節省成本等優勢。

比如在 Batch Norm Results 測試上,EXA POD 相比 GPU 有數量級的延遲優勢。

其次在跑經典圖像項目 RESNET-50 上,EXA POD 的計算能力超越輝達 A100。

最後在跑自動標註演算法測試上,EXA POD 以倍增的性能超越輝達 A100。

而在替代性方面:

一個 EXA POD 相當於六個 GPU 的成本,四個 EXA POD 可以替代 72 個 GPU RACKS,相當於在同樣的成本下,EXA POD 的性能高 4 倍,能耗比高 1.3 倍,空間縮小 5 倍。

總而言之,特斯拉 DOJO 的研發進度其實已經接近尾聲。

這也意味著馬斯克再一次清晰勾勒出 FSD 的最終形態,畢竟對於那些無數的邊緣場景,只能通過真實世界的視覺 AI 來解決,AI 晶片只能算是錦上添花。

這也是馬斯克曾經認清的一個事實:

只有解決了真實世界的 AI 問題,才能解決自動駕駛問題——除非擁有很強的 AI 能力以及超強算力,否則根本沒辦法。

而這,也是特斯拉啟動 DOJO 項目的原因。

以 Alpha Go 專攻圍棋為例,在經過人工參與調整和標註的訓練,進而擊敗全球圍棋高手。

而 DOJO 可以視為專攻自動駕駛領域的 Alpha Go,通過深度學習和分析海量的特斯拉車隊資料,DOJO 可以自動處理標註資料、自動尋找問題最優解。

按照規劃,特斯拉將於 2023 年第一季度在美國帕洛阿爾托完成七台 EXA POD 的建設。

這意味著 DOJO 超級電腦將成為世界上最強大的超級電腦之一,能夠將需要花費數月的標註工作縮減至一週。

「至少可以幫助你用更少的錢,更快地訓練模型的線上服務。」最後馬斯克補充道,DOJO 超級電腦將來會像 Amazon Web 服務一樣,通過付費的形式提供給其他使用者在雲端使用。

特斯拉,一個新時代名詞

僅僅一年時間,特斯拉就不僅把去年的人形機器人彩蛋變為現實,包括背後的工程技術、開發邏輯、成本費用等等,特斯拉背後的工程師團隊已經信心滿滿。

值得一提的是,特斯拉人形機器人的感知和技術部分基本沿用特斯拉 FSD 方案,包括特斯拉 D1 晶片整合的系統作為」大腦「,以及面部八顆 Autopilot 攝影機。

特斯拉工程師表示,特斯拉人形機器人通過頭部的攝影機採集感知資料,再通過 FSD 視覺演算法進行識別,從而行走、執行指令等等。

言外之意,特斯拉人形機器人並不是按照傳統程序單一的執行指令,而是通過 AI 模型自主學習。

正如馬斯克所言,通過 AI Day,我們希望外界對特斯拉的認知能夠超越電動車,我們是 real-world AI(人工智慧)領域的時代先鋒。」

活動現場,馬斯克也再次重申特斯拉舉辦 AI Day 活動和展示機器人原型產品,「是為了說服像你們這種全世界最有才華的人加入特斯拉,幫助我們把它變成現實。

確實,對於這樣一家火力無限的公司,特斯拉或許已經是一個新時代名詞。

本文經授權發布,不代表36氪立場。

如若轉載請註明出處。來源出處:36氪