建置台灣客語語料庫 開創客語AI時代

TVBS新聞

為了保存客家文化、語言,客委會結合語言、資訊和傳播三方專家,建置台灣客語語料庫,將文字和語音數位化,讓客語進入AI時代,和國際接軌。


圖/TVBS
圖/TVBS

語言是文化傳承最重要的基礎,為了保存客家文化.呈現客語原貌,客委會從106年起,開始建置全球第一個,由官方帶頭成立的客語語料庫。


圖/TVBS
圖/TVBS

客委會主委李永得:「透過數據數位化的保存,不但讓我們的語言做完整的保存,同時將來可以運用到AI,跟所有不同的語言對話,這個是保存語料庫很重要的一個意義。」


由語言,資訊和傳播三領域專家,帶領團隊蒐集、處理、建置系統,等複雜、繁瑣程序後,再將語料轉化成資訊,目前已經有書面語料500萬字,口語語料超過10萬字。


圖/TVBS
圖/TVBS

客委會主委李永得:「政大這個團隊,超出我們的預期,總共蒐集了書面語料有500萬筆,口語的已經有10幾萬筆。」


透過語料庫,客語也能與時俱進,朝向AI發展。

更多 TVBS 報導
韓控成立的同鄉會被查稅 蔡總統:正常運作
客家跨界音樂列車深入校園 高唱電音客家歌
韓國瑜直播煮客家菜 笑稱「倒酒我來就好」
樟之細路 步道漫遊細看親近客家庄

你可能還想看