法院筆錄不再拖! AI語音辨識正確率破9成將供刑事庭使用

為了加速國民法庭做筆錄的速度,司法院之前特地開發出一套「法庭中文語音辨識系統」(簡稱AI語辨系統),經過各地國民法官模擬庭適用,及將過去1千多萬筆的裁判書、開庭筆錄當作AI訓練資料,優化後目前辨識正確率超過92%。司法院表示,這套系統除了供國民法庭使用,也將擴及一般刑事案件。

圖片
司法院推出的法庭中文語音辨識系統,迅速縮短筆錄製作時間。陳品佑攝

司法院表示,筆錄是法庭程序進行的重要資料,最早是由書記官手寫筆錄,隨著電腦普及,改由書記官聽打製作,但聽打需要經過聆聽、理解、繕打、校對等過程,再快的打字速度,也難以跟上正常的語速,法庭上所有人往往都得等書記官打好上一段內容,才能進行下一段程序,證人證述時,常因為筆錄來不及製作而被打斷,這是目前法庭常見風景。

未來,法庭風景即將改變。 司法院表示,隨著人工智慧(包含機器學習、深度學習)的語音辨識相關技術日益成熟,司法院也投入開發語辨系統,包含逐字稿作業、後台辨識引擎服務、司法文書編輯(含精簡模組)系統、法院審判筆錄及數位錄音系統、錄影回放系統、影音環控系統。藉著語辨系統的協助,在開庭過程中可以即時產出逐字稿筆錄。

司法院表示,國民法官制度為了讓國民法官盡早結束審判工作,回歸正常生活,審理程序將連日、連續進行,只要審理程序結束,就要開始進行評議。因此,語辨系統馬上產出的筆錄,就可以立刻呈現法庭內發言內容,評議時也可以回放特定的錄影段落確認,國民法官的審理將更流暢。

目前全國22間地方法院的國民法官法庭都已建置這套系統,此外,除了國民法官適用的重大刑事案件,一般刑事案件也可以使用國民法官法庭配置的語辨系統產出即時筆錄,司法院更規劃讓一般法庭陸續建置語辨系統,讓法庭進行更流暢、更快速。

司法院表示,語辨系統除了各地院模擬國民法庭試用過,也投入過去10幾年的裁判書(約1千多萬筆)、開庭筆錄(約180萬筆)當作訓練AI的資料,進行優化辨識引擎語言(意)及聲學模型,目前平均辨識正確率已達92%,並支援絕大部分法律專用詞彙。

此外,司法院也預計於今年建置一般法庭語辨系統時,一併導入台語辨識部分,不過因為訓練的語料比國語少,推估台語的辨識率約為85%。

更多太報報導