Waymo結合大型自然語言模型,讓自動駕駛系統「解釋」自己是怎麼開車

Waymo近期公布一項技術,藉由大型自然語言模型串接方式,讓自駕車的自動駕駛系統「解釋」自己是怎麼開車。

Waymo結合大型自然語言模型,讓自動駕駛系統「解釋」自己是怎麼開車
Waymo結合大型自然語言模型,讓自動駕駛系統「解釋」自己是怎麼開車

依照說明,Waymo藉由名為LINGO-1的模型,讓自駕車的自動駕駛系統能針對電腦視覺所「看見」前方路況進行描述,同時也能針對車輛行駛時所作決策判斷進行說明,讓人能更了解自動駕駛系統實際運作情況,並且能針對錯誤判斷情況進行修正。

LINGO-1是基於視覺語言行動模型 (Vision-Language-Action Models,VLAMs)運作,亦即可讓自動駕駛系統針對攝影鏡頭所拍攝畫面進行分析理解,並且透過自然語言進行陳述,甚至講解採取決策的原因,讓人可確認自動駕駛系統的判斷是否正確。

Waymo結合大型自然語言模型,讓自動駕駛系統「解釋」自己是怎麼開車
Waymo結合大型自然語言模型,讓自動駕駛系統「解釋」自己是怎麼開車
Waymo結合大型自然語言模型,讓自動駕駛系統「解釋」自己是怎麼開車
Waymo結合大型自然語言模型,讓自動駕駛系統「解釋」自己是怎麼開車

相比過往必須透過各類分析判斷自動駕駛系統為什麼做出錯誤決策,透過人工智慧方式讓自動駕駛系統實際解說決策判斷原因,同時也能讓人更容易衡量自動駕駛系統的運作能力。

而除了可讓自動駕駛系統陳述其運作模式,透過LINGO-1模型也能反過來透過自然語言訓練自動駕駛系統。例如以自然對話告知自動駕駛系統避免哪些駕駛車輛方式,讓自動駕駛系統能透過理解對話內容,並且建立學習經驗。

以目前Waymo測試結果,透過自然語言訓練方式,在短短一個月內即可讓自動駕駛系統正確運作率從原本低於人的30%表現,提升至接近60%。如此一來,除了用於自動駕駛系統訓練,其實也能應用在機器人等裝置系統訓練,同時也能加快訓練效率與準確度。

Waymo結合大型自然語言模型,讓自動駕駛系統「解釋」自己是怎麼開車
Waymo結合大型自然語言模型,讓自動駕駛系統「解釋」自己是怎麼開車

更多Mashdigi.com報導:

目前由Apple Watch Series 9、Apple Watch Ultra 2獨佔使用的雙掐指操作手勢,最快於下週釋出測試版本

Razer推出與藍寶堅尼聯名合作的Blade 16遊戲筆電、Aether Lights系列RGB智慧燈具與新版軟體功能

深圳傳音推出採直向凹折使用的PHANTOM V Flip,搭配特殊圓形外側螢幕設計