2024台灣AI大賞|200萬聽損者福音!助聽器不再貴又不好用,洞見未來讓AI幫你辨識人聲
「其實還有許多需要 AI 助聽器的輕度聽損者,並沒有意識到其實也有適合自己的助聽器,能夠讓人與人的對話聽得更清楚。」洞見未來科技創辦人兼執行長陳柏儒提到,「AI 助聽器除了能夠讓過去無法適應傳統助聽器的重度聽損者,藉由人聲分離的聽得更清楚之外,也能讓輕度的聽損者,能夠有兼具外型與便利的選擇,提升自己的生活品質。」
傳統的助聽器基本工作原理包括三個主要部分:麥克風、放大器和揚聲器。助聽器通過麥克風接收聲音,將聲波轉換為電信號,然後這些信號被傳送到放大器。放大器增加信號的強度,最後通過揚聲器將放大的聲音傳送到耳內,讓使用者能夠聽到更清晰、更響亮的聲音。
不過,最大的問題是,傳統的助聽器會將聲音轉為類比訊號處理,「就像把一個超級大的喇叭塞進耳朵裡」,無論是使用者需要的聲音還是背景噪音,都被以同樣比率放大,變成難以理解的吵雜聲,相當地不舒服。另外,傳統的助聽器多數沒有藍芽功能,對於現代人需要使用手機視訊對話、聆聽音樂的需求來說,有很大的障礙。
用 AI 解決聲學領域的雞尾酒派對問題
加入 AI 的助聽器,最主要的功能就是能夠解決聲學領域的雞尾酒派對問題(cocktail-party effect)。這是指在環境中有其他對話或背景噪音干擾的情況下,人類還是可以選擇性聆聽特定聲音的能力。這是最早由英國認知科學家 Colin Cherry 於 1953 年提出的理論。但對於電腦來說,卻沒有那麼容易。直到導入機器學習後,電腦才能夠開始理解在某一段聲音中,哪些是使用者需要關注的?哪些則是常見的背景雜音?將需要的數位訊號放大,並將不需要的訊號盡可能地過濾掉。
陳柏儒自己就是助聽器的長期使用者,因此相當能夠體會傳統助聽器的種種不便,在開發的過程中加入了許多重要的使用者意見。創業之前任職聯發科的他,花了相當多的時間,研發獨創的 AI 多人聲分離引擎,終於有所突破,就雞尾酒派對問題提出解決方案。
「我們一開始為了打磨這個 AI 模型相當辛苦,除了既有的資料庫之外,也需要靠自己去收錄街道上的背景噪音,好建立初步的訓練資料。」陳柏儒回憶,「其實傳統的助聽器大廠對於傳統的音訊處理方法已經相當熟悉,我們唯有導入 AI ,才能夠快速地趕上他們。除了訓練模型外,系統整合也相當重要,如何在一定的預算內,找到足夠節能的晶片,讓使用者能夠夜間充電、全日使用;演算法也要優化到讓晶片能夠跑得動,才能做出好用的產品。」
洞見未來希望助聽器也能擁有現代化設計,且使用者能夠自行微調耳機的部分設定,更符合個人需求。
AI助力,融合最新技術,打造符合現代化需求的助聽器
他強調,現代化的助聽器除了要導入 AI 功能做出不同聲音的差異化之外,導入優異的藍牙技術,提升真實性和便利性也非常重要。以聆聽音樂為例,透過手機喇叭傳到助聽器放大後進到耳朵的聲音,與手機直接將訊號透過藍牙,進到耳朵的感受是完全不同的,後者在真實感和沉浸度都遠遠優於前者。
另外,現在的使用者也常常有視訊對話的需求,無論在外型和功能都要更接近藍牙耳機的助聽器,使用起來才會更為方便。
剛開始配戴聽器的使用者,常常會需要頻繁調整助聽器的設定,因此需要常常往來醫院或專業聽力中心,相當耗費時間。洞見未來透過 APP ,讓使用者也能夠運用簡單的介面,在不同的環境中切換模式或是自行微調助聽器的設定,讓助聽器能夠更加符合自己的需求。
「目前市售全球五大集團的助聽器所使用最好的晶片製程是 28nm,但 22nm 以下的製程,才能在兼顧省電性能的前提下,讓深度學習的模型發揮得更好。但我們認為每一個使用者配戴助聽器的經驗都是獨特的,所以在APP上開放完整的調音介面,從使用者體驗直接下手改善,才有辦法達到最好的配戴感受。」陳柏儒強調。
從台灣走向全球,走向更寬廣的全球市場
助聽器市場歷史相當悠久,有些全球廠牌甚至有百年的歷史,如何打入全球市場也是洞見未來最重要的挑戰。「2019年獲選為首屆高通創新競賽冠軍,並加入「高通擴展計畫」(Qualcomm Extension Program)對我們來說非常重要,」營運長陳宥任說,「也是因為高通的協助,讓我們在技術面和商業面都有了很大的成長,獲得了不少資源,打開了全球的人際網路。」
他進一步說明,高通是世界上知名的晶片大廠,採用高通的產品,有助於跟經銷商或消費者解釋,品質上也更有保障。另外,高通非常願意扶植第三方的開發者,在晶片的使用細節和大量製造上的技術支援都給予了許多的幫忙,這對於新創企業來說非常珍貴,減少了很多摸索的時間。
另外,傳統的助聽器大廠通常是針對重度聽力損失者提供高價位的產品,並極度仰賴醫院和專業聽力中心作為銷售的管道。「有了高通的資源,我們藉此也接觸了原本接觸不到的客戶,是我們打進全球市場的助力。」陳宥任說。
新技術定義,讓意想不到的小功能改變未來的助聽器市場
隨著藍牙晶片不斷進步,未來 AI 助聽器與環境的互動也令人期待。例如藍牙技術聯盟(Bluetooth SIG) 在 2022 年發表的 Auracast 技術,是基於低功耗音訊(LE Audio)的廣播音訊,打破過往藍牙裝置一對一連接的限制,能夠具有廣播的功能,讓特定範圍內不限數量的藍牙裝置收聽重要的資訊。
在未來,支援 Auracast 的助聽器,便可直接從助聽器接收地下鐵的廣播訊息、機場的登機提醒,或直接從電視、電影院或喇叭的拾音器廣播到助聽器。Auracast 也支援和朋友建置音訊泡泡,在一定距離或吵雜的環境內更自由地對話。這都讓未來配戴現代化助聽器的使用者,能夠享受更好的生活與娛樂品質。
陳宥任表示:「初估計,台灣失能性聽損人口大約有兩百萬人,可是實際配戴助聽器的人則低於10%。有許多人其實是輕度聽損者但並沒有自覺,並不了解配戴現代化的助聽器,其實可以有效改善生活品質。」 隨著AI模型和晶片製造技術的進步,現代化的助聽器將能進到下個世代,讓更多隱性的聽損者,也能享有現代科技的美好。