推廣台語! AI語音系統使用鄉土戲劇當語料

為了讓更多台灣人能學會台語、活用台語,北科大和交大共同開發出一套「AI台語語音辨識系統」,為了讓資料庫更完備,團隊和民視合作,使用《親戚不計較》、《娘家》、《幸福來了》等多部民視台語戲劇作為研究語料,共計3000小時,幫助訓練系統模型,提高準確率。

電視台八點檔,演員全台語發音,不少年輕人卻聽不懂,為了讓台語能活用,北科大和交大共同開發出一套「聽得懂台語」的語音辨識系統。播放台語新聞,螢幕就能即時秀出字幕,事前得先建立語調庫,團隊橫跨全台,找600多位民眾錄音,蒐錄各地台語腔調共300多小時,更和電視台合作,透過戲劇訓練系統模型。

北科大電子工程系副教授廖元甫說,「目前保存台語最多的,其實就是電視台的鄉土劇,所以我們就是跟民視要了蠻多小時的語料,這邊應該就至少有1000或2000小時的語料,上千的語料,拿這個去訓練才有希望。」

多年來致力於推廣在地文化的民視,這回提供團隊《親戚不計較》、《娘家》、《阿不拉的三個女人》、《春花望露》和《幸福來了》等台語劇,共計3000小時,作為AI語音辨識的語料,而目前系統準確率已達80%!

民視董事長王明玉說,「我敢說這是台灣第一完整的資料庫,交大也很厲害會找到我們,這是我覺得自己也很驕傲的地方,因為我們注重台語。」

民視新媒體事業群副總經理王宗弘表示,「這次跟交大跟北科大的合作,讓民視的這些戲劇,除了在傳統電視上應用以外,也在AI領域找到另外一個發光發亮的地方。」

電腦也會開口說台語!團隊還開發出另一套系統,只要輸入中文,就會像Google翻譯一樣「教你念」,透過4名專業台語老師聲音合成,目前已經有網頁板,未來更規劃推手機APP,期盼讓更多台灣人能輕鬆學台語。

(民視新聞/綜合報導)

更多民視新聞報導
入冬最強冷空氣發威? 專家:跨年恐探10度以下
有機米也有鎘! 最多超標8.25倍 嬰幼兒不宜
響應政府政策! 大立高跨足能源事業打造下個50年