台大醫院首用語言模型應用於疾病分類編碼
台大醫院二十八日宣布,已在大型語言模型發展取得突破,目前訓練本地端大型語言模型(LLM)應用於疾病分類編碼任務,兼顧科技創新與資訊安全。由醫務秘書陳信希領軍,病歷資訊管理室主任莊秋華擔任計畫主持人,以去辨識的病歷資料,結合病人多樣態的就醫紀錄資訊,創新導入專家知識於模型訓練,開發出AI疾病分類編碼系統。
台大醫院指出,這項創新的疾病分類輔助系統已於去年三月在台大醫院醫療體系上線,可以節省百分之十四的人力工時,還可以提升準確率。隨著生成式人工智慧技術不斷地推進,基於大型語言模型的最新版疾分編碼系統,在今年十一月上線使用,其效能更突破先前版本,短短一秒即可產生住院病人的ICD-10-CM/PCS疾病分類編碼(包含診斷碼及處置碼)。
疾病分類是世界衛生組織(WHO)依據疾病特性及規則等將疾病分門別類,以代碼來表示,目前台灣採用國際疾病分類第十版臨床修訂版(ICD-10 CM),作為健保申報、衛生政策制定、教學、研究參考,還可作為國際間比較。去年七月衛福部修訂「醫療機構電子病歷製作及管理辦法」,各家醫院已可使用雲端服務來改善醫療支援系統。
陳信希指出,台大醫院擁有先進深度學習及生成式AI技術,以及大量的訓練資料,收治病人的疾病種類龐雜,最大特色就是優秀的疾分團隊所建立系統化專家知識回饋流程,週期性模型更新。隨著人工智慧技術不斷推進,大型語言模型可以輔助院內許多服務。
然而,病歷資料屬於敏感性的個資,十分重視資料安全,因此,推動醫院本地端大型語言模型是必然趨勢。