Android 的實時聲音轉錄文字工具可以辨識低語或是狗吠

Eric Chan
Engadget中文版

在等待 Android Q 的實時字幕功能之前,其實 Google 也有在測試一個實時的聲音轉錄文字的 Live Transcribe 工具,用途是針對協助聽障人士獲得外界的資訊。今天 Google 宣佈要為這 app 加入辨識環境聲音事件的功能,同時也加強了複製和儲存內容的能力。

就如上面示意圖所描述,當這 app 收錄到低語或是狗吠,就會在畫面下方顯示相關的圖示,讓使用者可以得知那是由人或是環境音所來的聲音。同時,因應這聲音轉錄文字工具也可以給學生或記者來作記錄之用,所以也加入了更方便的文字選取和複製方式。

Google 表示他們為了讓全球 18 億台合資格的 Android 裝置使用這功能,是主要透過雲端的機器學習和語音辨識功能驅動這 app,無需因為機器的硬體規格受限。

科技巨擘都在積極開發更強大的語音辨識和轉換工具,為的自然是給日後人類與機器之間有更好的交互體驗,尤其是讓 AI 能有更接近真人的自然交流能力。

Google

你可能還想看