小米 AI 相機 2.0 詳細技術解構,下代突破傳統技術,多層自定義優化

文章來源:Qooah.com

憑藉著多鏡頭組合的優勢,智能手機的拍照效果已經無限接近於入門傳統單反相機。然而,真正讓智能手機實現拍照技術飛躍的,還是要歸功於 AI 技術的加持。作為在 AI 拍照領域有著較大領先優勢的小米,近期在新近發布的全新版本 MIUI 12 中,已經將其 AI 相機升級至 2.0 版本。目前,AI 相機 2.0 版本已經適配小米10 系列以及小米10 青春版智能手機,此外根據小米官方的爆料,小米AI 相機2.0 還將持續地向更多機型適配,小米用家可以期待期待。

據悉,小米介紹稱,傳統的 AI 相機的做法,通常分成兩個部分,一是識別,二是後製處理。前者通過神經網絡來「認知」當前拍攝的場景,後者根據不同的場景,使用一些傳統的方式來針對特定場景做一些優化,比如加一些特殊的濾鏡。所謂「AI」,其實只有前面的識別部分跟 AI 掛鉤。

這種方式最大的問題是只能針對特定的幾個預設好的場景來做優化,並且針對同一個場景,只能採用一樣的模板來處理,而沒有針對當前的色彩,光影等做一些更有針對性的局部優化,效果會大打折扣。

AI 相機 2.0 詳細技術詳解:

1.為了解決傳統 AI 相機只能使用固定模板、針對預設場景優化的問題,相機算法團隊開創性的將傳統的場景感知拓展成為全方位的色彩、對比度、光影等內容感知。

2.小​​米還使用了深度神經網絡對整個畫面進行全局和局部的分析,獲取到最優的畫面效果,並且實時地對畫質進行增強。所以,新一代的 AI 相機能夠對所有的場景進行有針對性的畫質提升,讓同樣的一片草地,在不同的光照,角度,甚至背景下,新的 AI 相機都會有不一樣的優化效果。

3.小米把識別+處理技術合二為一,一站式的實現了 AI 修圖師的效果。為了實現上述功能,小米在拍攝的數據生成、AI 的訓練過程和處理速度進行了突破。

在數據生成方面,AI 相機 2.0 的目標是能夠產生美的圖片,這就包括要對原圖做雜訊,亮度,顏色,對比度,動態範圍等多個維度進行調整。對於深度學習而言,這樣的訓練集很難獲取。除了和團隊中的設計師合作PS 了數万張手機拍張數據之外,小米也收集了很多網絡上的高分圖片作為目標,使用 GAN 網絡( two path GAN,跟 cycle GAN 比較類似,能夠保證生成網絡生成的圖片跟原圖片的內容保持一致,僅僅去優化一些我們希望對原圖進行優化的維度。)進行訓練。

在 AI 的訓練過程中,小米使用的 loss 主要有 consistency loss,similarity loss, total variance loss , adversarial loss,通過不同的 weight 來控制生成網絡的優化方向和能力,從訓練機制、幀間一致性處理、開關模塊這三個方面進行升級。

而在處理速度上,2.0 的算法速度需要面對一個最大的技術挑戰是計算量,針對圖像像素處理的深度神經網絡的計算量極高,對手機的計算能力是一個很大的考驗,而小米目前向更高的像素進行進發,這對算法的速度要求更嚴峻。不過在小米團隊的不懈努力下,AI 相機 2.0 給出的答卷是相當驚人的。

此外,小米官方還透露,團隊已經緊鑼密鼓的開始了下一代 AI 相機技術的研發工作,在新的一代中,爭取在如下幾個維度上取得突破:

1.更多風格: 在尋找一種可以通過比較有限的數據集來快速訓練一種新的風格的技術,這樣可以在很短的時間內增加很多用戶喜歡的風格,最後可以完全替代濾鏡功能,甚至可以允許用戶自定義拍照風格。

2.更多維度: 除了色彩維度之外,計劃用類似的技術來處理亮度、對比度等不同的維度,完美的複制一個專業修圖師的大部分工作,全方位的提升拍照和錄影的整體畫質和觀感。

3.進一步優化性能: 目前 8K 錄影已經逐漸成為主流,因此對我們算法的處理時間和 RAM 佔用提出了更高的要求,我們也在做進一步的優化,爭取讓用家體驗到最舒服的 8K 錄製體驗。

此次的升級,讓我們清楚一件事,小米在追求更高的鏡頭規格的同時也不忘打下基礎,優化算法讓鏡頭能火力全開,這將讓小米設備的拍攝體驗與效果根據優秀。

 

為您推薦更多相關文章:

小米智能音箱新專利,外型似 Apple HomePod?