你是我的眼:人工智能革命的第一步從攝像頭開始

36氪
你是我的眼:人工智能革命的第一步從攝像頭開始
你是我的眼:人工智能革命的第一步從攝像頭開始

在上一篇文章“ 當我們討論智能家居時,不要忘記機器人 ”中,我提到了擬人化的人工智能可能成為智能家庭的中心設備。那麼問題來了,人機交互只能依靠語音命令嗎?那機器與環境的交互呢?

在2013 年秋季英特爾信息技術峰會(Intel Developer Forum,IDF)。英特爾帶來了很多給予英特爾芯片的產品,其中非常引入矚目的,就是這個原型來自瓦力的機器人,她的名字就是瓦力(Walle)。瓦力最重要的功能是:一、跟人打招呼;二、跟人握手;三、英特爾在機器人腹部放了一個屏幕,讓人們可以看到機器人是如何“看到”或者說感知世界的。

看看“瓦力”那萌萌的大眼睛!這簡直就是皮克斯送給人類最好的禮物。但很抱歉,從技術的角度來說,這兩炯炯有神的眼球只是裝飾品。機器人胸口的微軟Kinect 1 才是所謂的“眼睛”和“耳朵”。機器人通過Kinect 來獲取圖像和深度信息,以此完成從識別人到打招呼、握手的環節。因為Kinect 也配備了高清麥克風,所以順帶把“聽”也解決了。加之Kinect 本身俱備一定的運算能力,也起到了部分大腦的作用。

明白了吧?瓦力是通過深度攝像頭,來獲取真實世界的信息,並將其轉化成虛擬世界所需要的數據,然後加以處理的。目前有個時髦詞彙來形容這一整個過程,叫“機器感知”,或許馬上這詞就會跟“雲”一樣連老大媽都能說了。總之,你可以這麼理解,深度攝像頭就是下一代“電腦”比如機器人最重要的器官,這個器官將承擔新一代人機交互的重任——從人與手機,到人與機器人。

我上一篇文章介紹了蛛型機器人吧,那小傢伙身上也背著一個攝像頭是來自華碩的Xtion 。跟Kinect 1 可說是同父異母的關係,其核心技術都來自於一個父親的DNA—— Primesense ,一家長期致力於將深度攝像頭民用的公司。Primesense 不是深度攝像頭的始祖,但這場新人機交互革命,卻是這麼打響第一槍的,在Primesense 的背後,是無數的巨頭在為其舉著火把。簡單來說, Primesense 解決了很多數學算法問題,幫助他們能夠設計出來足以快速處理深度信息的芯片,這些芯片被授權給硬件廠商生產,這就是深度攝像頭的核心組件。通俗的比喻,就是圖像圖形界的英特爾。

Primesense 成立於2005 年,在2006 年對外宣布完成了3D 感應芯片的研發,在當年的E3 大展上與微軟建立了聯繫,並催化出代號為Project Natal 的神秘項目。等到2009 年E3 大展時,微軟發布了獲得PrimeSense 芯片授權的Kinect 1。於此同時獲得Primesense 授權的也包括華碩,這就是的由來。不過傳說微軟因收購Primesense 的失敗,在Kinect 2 時放棄了Primesense 。最終在2013 年11 月25 日,蘋果最終3.6 億完成了對Primesense 的收購。

看到了嗎?從微軟、英特爾再到華碩,最終是蘋果,在計算機業界里數的來的巨頭,都跟這家年紀尚輕的公司產生了聯繫。最早爆料蘋果要收購Primesense 的以色列媒體Calcalist 是如此描述蘋果的意圖:蘋果通過對PrimeSense 的收購,從而在室內娛樂領域獲得了關鍵性的技術。

在此之後,無數媒體都在預測蘋果將在客廳這個戰場上與微軟、索尼掰掰手腕,從新一代AppleTV 再到iTV。不過收購至今將滿1 年,蘋果看起來在這方面沒有任何消息,多少是讓人有點失望的。不過細想下也符合蘋果的作風:秘密開發然後一鳴驚人。

你是我的眼:人工智能革命的第一步從攝像頭開始
你是我的眼:人工智能革命的第一步從攝像頭開始

你要認為業界會因Primesense 的銷聲匿跡就平淡,那你就錯了。其實從Primesense 被收購開始,才正式拉開了新人機交互戰爭的序幕,曾經在觸屏或鍵鼠時代的不少巨頭,都在此後快速入場佈局。因為PrimeSense 被蘋果收購,其對外授權的技術將會在2015 年終止,所以那些使用了PrimeSense 技術的廠商們不得不尋找替代方案。很多人是看到了賺錢的新方式,比如很多國內的新興公司,比如小米。有些則是看到了顛覆的點,希望能夠扳回在手機時代的敗局,比如英特爾。還有些則是害怕被顛覆,比如蘋果。

來自中國的公司,有些名字你也許還不熟悉,不過他們或許是下一個世代的巨星。接下來,我將分國內和國外兩個部分,來解析巨頭們或者準巨頭們的佈局:

國內創業公司:

格靈深瞳主打智能安保的公 ​​司,此前36氪曾對格靈深瞳有過報導,他們也宣稱自己造出了帶有深度攝像頭的安保設備,這家微軟孵化器第二期的公司,看團隊履歷非常耀眼。不過我判斷他們的實際競爭力應該在軟件和存儲端,在硬件端大致上會傾向於採購更為合算的方案。

奧比中光奧比中光的核心目標就是取代Primesense ,他們從成立的那一天起就是希望能夠在彌補Primesense不再授權後,國內留下的市場空白。他們目標是做給基於安卓系統的新人機交互提供設備。主要市場之一是遊戲市場,比如那些主打遊戲功能的安卓盒子,特別是例子就是樂視電視。樂視電視此前已經具備體感遊戲功能,他們選擇的恰恰是由Primesense授權而生產的Xtion 。當Xtion存貨沒有後,奧比中光的產品是可以做到即插即用的。據悉他們在今年10月份已經完成了核心芯片的定型流片,預計會在2015年2月份(可能是春節期間)公開更多信息。

北京冰果這家公司從工商註冊信息來看,主要從事的是技術進出口。從多個渠道的消息來看,他們是在委託西安交大的某個研究所在做Kinect 1的複刻研發。跟奧比中光一樣,他們的目標也是取代Primesense取消授權後剩餘的市場。這家公司的人員組成尚不熟悉,如果有知道的讀者,可以郵件聯繫我。

酷感科技母公司是數碼視訊,股票代碼300079,主要持股人清華科技園,屬於清華的校企。清華的圖形圖像實驗室在計算機視覺是有非常重要地位的,可以推測這家公司的技術實力。他們對外宣稱已經完成了研發,目標自然也是取代Primesense。

國外的計算機視覺首先要談的肯定是大名鼎鼎的微軟Kinect,但是他們深度攝像頭的核心技術還是來自於授權, Kinect 1 是來自Primesense, Kinect 2 來自Canesta 。微軟長期以來的目標,是將深度攝像頭應用在遊戲場景下。不過有兩件事,讓筆者可以肯定微軟會開始對Kinect 進行小型化,並應用在新的場景裡。

首先,隨著機器人視覺的再次興起,微軟在此前IROS2014 chicago 上推出的開源機器人,工程圖標註的是啟用了Kinect 的核心傳感器;其次,回想下比爾- 蓋茨同學在2007 年那次D5 峰會上第一次談及3D 感應器,實際上那個點他們已經和Primesense 取得了合作,所以蓋茨會說他們已經有貨了。那次D5 峰會上蓋茨所談及的願景是無處不在的攝像頭,希望人們走到哪裡,都有一個操作系統;無論是走到哪都能通過Kinect 操作的設備,還是走到哪都能跟到哪的機器人,確實符合這樣的想法。Windows 10 的目標又是要做物聯網的樞紐從而無處不在,那麼Kinect 或者其他名字但實現更強大功能的“器官”也會需要部署到無處不在吧。

可以這麼總結,微軟擺脫Primesense 後做出的Kinect 2 相比Kinect 1 是飛躍性的革新產品,在一定時間內,微軟在這個領域會保持其技術優勢。除了微軟之外,在這一領域的大公司和國外的創業公司還有:

Primesense被蘋果收購之後,Primesense宣布將在2015年停止授權,看來是鐵了心要自己做包含深度攝像頭的硬件。到底是電視還是合作,或者來個蘋果的機器人?筆者就不再猜測了。不過這裡可以提供一個有趣的事實, Pirmesense實際比任何一家都要更早的完成了微型版深度攝像頭的研發。2012年下半年, Primesense就完成了代號“Capri”的微型深度攝像頭設備的研發,他們的目標是筆記本、平板甚至是手機裡。不久的未來,也許在某代iPhone裡就能看到了。

Pebbles Interfaces 這家公司被小米投資了,因為小米沒有相關的技術儲備,未來也不會有這個打算。通過這筆收購,小米得到了關於3D 感應器(核心芯片)的相關授權。還簽訂了三個月的排他協議,相信在未來小米智能電視和盒子上會看到體感應用了。

英特爾購買了softkinetic公司的核心技術,然後推出了自己的深度攝像頭設備——Realsense。Realsense分別有對應安卓和Windows的型號,也有對應超極本和平板的版本。可以看出來英特爾在努力做深度攝像頭的小型化,並鐵了心的要抓住下一代人機交互的入口。就跟小米投資的Pebbles Interfaces和Primesense一樣, softkinetic來自比利時。

谷歌購買的是來自Movidius這家公司的技術,主要應用在Project Tango這個項目上,主打3D感應手機這個概念。

Leap Motion這家公司很早就為國人所知,此前他們也跟神州合作進入了中國,除了主打電腦端的人機交互外,還希望能進入車聯網這樣的領域。操作精確度一直是Leap Motion強調的重點,不過可能由於過度強調精確度,反而使得Leap Motion操作體驗的不佳。加之他們在處理跟開發者的關係上屢屢出問題,導致後繼無力。

如果有機會,筆者應該將Primesense 、 Pebbles Interfaces 和softkinectic 這樣來自以色列的親身父親做個詳細的介紹。不過在這裡省略也是有意為之,因為實際上這些公司的研發是非常消耗金錢,這就是為何Primesense 在發展的風生水起的時候,卻在2012 年將公司員工從190 人砍至50 人的原因。失去微軟支援的他們,實際上是失去了源源不斷的財源,而哥斯拉級別的微軟卻有能力另立門戶,直接用錢燒出一台Kinect 2。

需要大量的金錢去完成研發,這就是深度攝像頭在上游的現實。這也是為何只有微軟、蘋果、谷歌才能稱得上真正的玩家,而Leap Motion 這樣的廠商往往後繼無力。Pebbles Interfaces 則是直接來到中國完成的融資,站在他們身後的是小米這樣的新巨頭為其輸送砲彈。

也許超級巨頭的入場,預示著下一代人機交互的到來,但新巨頭的集體佈局,也預示著這個行業在硬件端門檻之高。那麼捉摸著在這個領域創業的人們,他們可以做什麼呢?

做智能家居、家庭機器人的,可以向以上公司採購設備,對交互要求不高的可以選用國內公司的方案。以前做互聯網做APP 的公司,不如跟筆者一樣,老老實實做應用。不過在新人機交互下的應用,對於每個應用場景的理解將上升​​幾個層級的要求,甚至開發者們還要讀懂更多平台傳輸來的數據。

因為在這個即將無處不在傳感器的時代,我們將在真實世界裡廉價的捕捉到大量數據,讀懂這些數據,才能從虛擬世界獲得更多的幫助。

海盜們,準備好迎接這場革命了嗎?

本文作者黎明明,運動行聯合創始人,看台FM 主播。長期接觸智能硬件和體感領域產品。郵箱:limingming@bifenpai.com 微信:paulaugust

[本文來自讀者的投稿,不代表36氪立場]

你可能還想看