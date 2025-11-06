台大公衛學院副教授、玉山青年學者李達宇今（6日）發表一項7月刊登於《npj Digital Medicine》的研究。左為台大公衛學院院長鄭守夏，右為台大醫院環境及職業醫學部主治醫師陳保中。（林周義攝）

不少民眾習慣透過AI尋求預防保健、醫療資訊。台大公衛學院副教授、玉山青年學者李達宇今（6日）發表一項7月刊登於《npj Digital Medicine》的研究，針對ChatGPT、Claude、Gemini3大主流模型在中風照護資訊的提供表現進行系統性評估，發現這些語言模型的臨床表現都低於60分，提醒民眾別把AI當醫師，緊急情況下的微小誤判，也會危及生命。

李達宇表示，家裏有生病的人都會知道，照顧需要耗費很大的心力，過去他照顧媽媽期間，曾因媽媽出現皮膚問題，而尋求ChatGPT的幫助。AI的進展的確帶來很多驚人的成果，可以幫助資歷較淺的醫師進行判斷，但當民眾遇到攸關性命安全、高度仰賴專科判斷的現場時，AI卻難以跨域「安全」、「可靠」的門檻。

研究團隊以ChatGPT、Claude、Gemini3大主流語言模型，模擬多種貼近臨床情境的中風照護場景，運用多種提示設計策略，全面評估準確性、同理性、可操作性與安全性等面向的表現。團隊發現，3大語言模型在個提示工程方法（ZSL、COT、TOT）下的臨床整體表現都低於合格門檻 60分，少數情境可略高於60～65分。高風險的醫療，微小的錯誤可能付出生命的代價。

台大醫院環境及職業醫學部主治醫師陳保中提醒民眾，不能把AI當醫師，AI只能作為輔助工具，病人可以詢問AI自己該看哪一科，而不是靠AI做出醫療決定。至於日常的保健資訊，李達宇提醒民眾，使用語言模型時，不妨加入自己的性別、年齡、家族病史、環境暴露情況、用藥與就醫資訊，以提高健康資訊的可信度

