科大訊飛聯合創始人兼高級副總裁江濤:AI連接萬物,共創新時代 | 2019 WISE 超級進化者大會

7月9-10日,36氪在北京和上海同步舉辦“2019WISE超級進化者”大會,活動設有七大會場,關注企業發展變革路徑、行業風向把握、零售行業的進擊與蛻變、萬億企業服務市場的崛起、產業創新機會、全球化趨勢與差異化需求的爆發邏輯等議題,邀請超百位行業領袖,聚焦那些引領行業變革的超級進化者的崛起之路。

萬物互聯時代,人工智能取得了突飛猛進的發展,語音合成、識別等技術也在司法、教育、醫療、家庭等多場景上落地。未來還有哪些應用可以大規模的進行產業化落地,實現從算法到應用的持續疊代成為最受關注的問題,也成了未來人工智能領域最大的產業機會。對此,科大訊飛聯合創始人兼高級副總裁江濤認為,一方面要讓機器從能聽會說到能理解、會思考,從感知智能進階到認知智能。另一方面,人工智能不光要實現技術突破,還要形成量大面廣、可以在商業上獲得巨大成功、有影響力的產品,讓用戶真正有意願付費購買,為你的產品“投票”。

AI連接萬物,共創新時代
AI連接萬物,共創新時代

以下為嘉賓演講實錄:

各位開發者、創業者,大家上午好!

科大訊飛是由一群中國在校大學生發展起來的上市公司。1998年科大訊飛的團隊成員還是中國科技大學實驗室裡一幫做研究的人,1999年才成立了這個小公司。今天看到這個主題“超級進化者”,我們還是蠻有感觸的。2008年科大訊飛上市,33億的市值。上市十年之後,規模進一步擴大,也跟大家一樣共同面對人工智能時代巨大的產業機會。

今天想跟大家分享我們對人工智能時代產業機會的看法。從科大訊飛的角度來看,人工智能已經發展到了什麼階段呢?首先要跟大家回顧一下科大訊飛過去十年,在人工智能上所做的工作。

2010年全球有兩家公司基於深度學習算法,在語音識別上第一次做出了突破。一家是谷歌,做了英文的連續語音識別。另外一家是科大訊飛,2010年10月28號在北京香格里拉酒店,發佈了全球第一個連續中文語音識別系統,這個系統在全球也是領先的。我們用了幾年時間,把深度學習理論框架進一步琢磨透了以後發現,深度學習這套體系,不光是解決機器能聽會說的問題,也可以進一步延伸到能理解、會思考。很多有規律可循、重複性的腦力勞動,在特定任務裡拿到足夠多的過程化數據,有足夠多的領域專家給我們訓練,在特定任務上機器可以不斷逼近這個領域的專家水平。2014年我們開了一個很大的發佈會,正式啟動了“訊飛超腦”這個項目,它要解決的問題就是讓機器從能聽會說到能理解、會思考,從感知智能到認知智能。

科大訊飛在努力探索從能聽會說到能理解會思考,有哪些應用可以規模化落地,可以實現從算法到應用的持續疊代。過去幾年的探索下,2018年科大訊飛在包括教育、醫療、司法等領域的賽道上,已經跑出了一批非常好的應用。在我們公司的大會上,劉慶峰董事長跟大家說,現在科大訊飛人工智能戰略到了2.0階段,就是紅利兌現期。人工智能不光要實現技術突破,還要形成量大面廣,可以在商業上獲得巨大成功、有影響力的產品。

AI連接萬物,共創新時代
AI連接萬物,共創新時代

我們回過頭來再看看人工智能的核心技術發展到什麼階段了,首先看一下語音合成技術。今年中央廣播電視總台聯合科大訊飛,基於我們的技術做了全球第一個多語種的虛擬記者“通通”。我們拍攝了主持人的形象,錄了一小段視頻,可以讓機器說世界主流的語言來當主持人。這不光可以用在央視,像36氪這樣的媒體合作夥伴也是有需求的,它能讓你們的內容變得更加生動有趣,更加個性化。

語音識別這幾年取得了突飛猛進的發展,但隨著萬物互聯時代的到來,語音識別的要求也越來越高了。在萬物互聯時代,很多設備離我們比較遠,比如智能家居。如果你要走到設備的開關面前再說指令就沒有意義了,還不如直接摁一下開關。智能家居,就是要在遠距離情況下,能控制家用電器。在高噪音的情況下,比如一邊開車,一邊語音命令控制。在遠距離、高雜訊、多人說話的情況下,語音智能還能不能做到,這才能體現出萬物互聯的價值。

去年,在號稱史上最難的語音識別比賽CHIME-5上(一個在廚房、起居室等各種場景下進行的高難度比賽),科大訊飛作為中國代表擊敗了美國同行,拿到了全球最好的水平,在所有的四個主要指標上都囊括了全球第一。基於這些技術的突破,人工智能從去年到今年在大規模的進行產業化落地。科大訊飛也發佈了一系列圍繞辦公場景的產品,比如轉寫機,現在有一些基金公司在購買使用。它是一個小箱子,一打開可以實現會議記錄。會議開完以後,生成一個二維碼,所有在場的人一掃二維碼,從PPT到演講者說的話、從語音到文字,都可以直接分享查看。我們還有智能辦公本,大家開會中說的語音內容也可以變成結構化的文字。除此之外,會議記錄系統、智能錄音筆,都在618取得了很好的售賣成績。我們是把辦公場景產生的聲音和手寫的文字,變得可保存、可檢索、可統計、可分析,極大提高辦公效率。我相信這個場景未來有很大的空間,這是人工智能實實在在落地的、已經達到的規模化應用。

當然光講技術突破沒有用,還要看用戶是不是拿他的錢來為你的產品“投票”。剛剛過去的618,在京東、天貓這些平台上,科大訊飛圍繞辦公場景做的一系列產品,都得到了市場的高度認同,比如“機器翻譯”。科大訊飛去年的機器翻譯推動實際規模數據的統計對比結果,已經遠遠超過六級考試的大學生水平。而基於這項技術開發的訊飛翻譯機,也得到了市場的認可,已經覆蓋了200個國家和地區,在今年618眾多翻譯機品類中遙遙領先,得到的用戶的廣泛認可。

AI連接萬物,共創新時代
AI連接萬物,共創新時代

剛剛說了“能聽會說”的規模化應用,從2014年科大訊飛啟動“訊飛超腦”之後,科大訊飛重點加碼的領域,是從能聽會說到能理解會思考。圍繞很多腦力勞動者,也就是產業互聯網中的需求,除了語音之外,進一步到了認知層面。這些腦力勞動者在特定任務上的表現,機器也在不斷學習。這裡有一項基礎技術叫機器閲讀理解技術,也就是機器對於人類自然語言描述的文章能讀懂多少。在“訊飛超腦”項目支持下,這方面的研發加大了力度。去年1月22號的SQuAD上,科大訊飛首次在F1指標上,超過美國大學生水平。這是斯坦福舉辦的機器閲讀理解的挑戰賽,谷歌、微軟、IBM、Facebook等全球主要的科技巨頭都參加了。尤其是微軟,這幾年持續加大對人工智能的重視,且微軟過去幾年裡都在這項比賽中保持了全球領先。但是2018年1月份,我們超過了微軟。目前在精確匹配指標上,全球有兩家公司超過了美國大學生水平,一是家微軟,一家是科大訊飛,而且我們得分比微軟還高。今年3月20號,我們用全新的算法,再次刷新了記錄。在SQuAD 2.0比賽中,精確匹配和模糊匹配,我們都超過了美國大學生的水平,這是機器閲讀理解領域非常有里程碑意義的測試。

機器閲讀理解達到了這樣的水平,在應用上有什麼變化呢?教育領域是個例子。在前年一些典型的比賽比如高考、研究生考試上,機器在批改作文的主觀題上,已經達到了人類專家的水平。機器無論是小分差、中等分差還是大分差上,都比人類的閲卷老師有明顯的優勢,改得更準、評分更穩定。基於這些技術突破,我們通過人工智能可以系統分析孩子寫在紙上的內容,然後把孩子做作業、考試的過程化數據收集到,分析孩子的薄弱環節,給他提供個性化的指導方案。

除此之外還有醫療領域的應用。科大訊飛是全球唯一一個通過了國家醫師資格考試的技術系統。國家的醫師資格考試滿分600分,科大訊飛的系統跑了456分,超過了2017年53萬考生理的96.3%,具體的臨床問題機器能夠分析,並給出解決建議。在去年我們把這項技術真正做成了產品投入應用,到今年年初每天已經有1.3萬個真實場景下的輔助診療的案例產生,覆蓋了900多種常見的疾病。這套系統不是給最頂尖的醫生用的,而是給基層醫院社區、縣級醫院的醫生用,減少他們的漏診、誤診。95%的常見病,機器都能提供建議,診斷的準確率也在不斷提升,目前是達到了97%。隨著數據規模不斷提升,未來的準確率還會持續提高。

當然人工智能是一個偉大的歷史進程,不是三五年就能走完的。人工智能的核心技術從算法上,包括對小樣本、無監督的場景進行持續訓練,怎麼跟腦科學、類腦科學進行結合,還有很多工作要做。人工智能在應用模式上,怎麼實現人跡協同,也都還有大量要探索的工作。從感知智能到認知智能的很多核心技術,我們都已經把它包裝成科大訊飛開放平台,向所有開發者開放。現在這個平台上已經有100萬開發者,在場也有很多創業者,希望大家都可以到科大訊飛的人工智能開放平台上來。你不用管深度學習底層的技術實現有多複雜,你儘管在熟悉的領域做擅長的事情,把複雜的人工智能算法交給科大訊飛。通過這個平台,我們希望幫助大家共同獲得成功。

本文經授權發布,不代表36氪立場。

如若轉載請註明出處。來源出處:36氪

你可能還想看