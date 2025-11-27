AI 建議可信度有幾高？英測試：ChatGPT、Gemini 亂教投資、保險、法律意見分分鐘中伏
最新研究揭示熱門 AI 聊天機械人在財政、法律、旅遊建議上頻頻出錯，高分信賴危機應點自保？
近年來，以 ChatGPT 和 Gemini 為首的生成式人工智能工具迅速普及，已成為不少港人日常搜尋資料的新途徑。然而，英國消費者組織 Which? 最新的深入研究敲響了警鐘，揭示出大眾對 AI 建議的信任度與其實際準確度之間存在令人擔憂的落差。測試結果顯示，這些主流 AI 工具在處理涉及消費者權益、法律及財務等重大生活領域的查詢時，頻頻出現錯誤、誤導甚至可能帶來金錢損失的建議。
財經法律「高危」領域 AI 錯誤百出
Which? 針對六款主流 AI 工具進行了 40 個涵蓋消費者四大核心領域的測試，發現 AI 輸出的結果在「高風險」領域尤其不可靠：
1. 投資理財陷阱：
在關於個人儲蓄賬戶（ISA）免稅額的測試中，研究員故意將英國法定上限 £20,000 錯寫成 £25,000，結果最受歡迎的 ChatGPT 和 Copilot 均未能識別並糾正此錯誤，反而依據錯誤的金額提供進一步建議。若用戶依從，可能導致超額認購 ISA，違反英國稅務規定。此外，在詢問如何申領退稅時，ChatGPT 和 Perplexity 錯誤地將高收費的私人退稅中介服務與官方免費服務一同推薦，用戶一旦誤點，便可能被徵收高昂的行政費用。
2. 旅遊權益建議不準確：
Copilot 在航班延誤或取消的權益問題上，提供了「總是享有全額退款」的誤導性資訊。而 ChatGPT 則錯誤地聲稱英國居民前往神根公約區（Schengen）國家必須購買旅遊保險。這些資訊上的失誤，可能讓消費者在與航空公司或保險公司交涉時，低估或誤判自身的應有權益。
3. 法律及合約爭議風險：
當詢問到建築商施工不良時的處理方式，Gemini 建議用戶直接「扣起款項」，但 Which? 專家警告，這種做法可能導致糾紛陷入僵局，甚至可能構成違約，反而削弱了消費者本身的法律地位。同時，Gemini 也未有提醒用戶在訴諸小額錢債審裁處前應先尋求專業法律意見。
評分結果：ChatGPT 倒數第二 Meta AI 包尾
在測試結果中，各 AI 工具的表現差異極大：
AI 工具
總評分（滿分 100）
評語
Perplexity
71%
居榜首，準確性及實用性得分最高。
Gemini AIO
70%
略優於標準版 Gemini。
Google Gemini
69%
表現中等。
Microsoft Copilot
68%
表現中等。
ChatGPT
64%
倒數第二，作為最常用的工具，可靠性成疑。
Meta AI
55%
表現最差。
研究總結，雖然 AI 在整合網上資訊方面有強大用途，但面對複雜且高風險的消費者問題時，其建議仍有大量改進空間。高達 47% 的受訪者表示對 AI 資訊有「合理」或「很大」的信任，這與 AI 實際輸出之間的差距，是對公眾權益的一大威脅。
專家建議：如何安全地使用 AI 建議？
Which? 科技專家 Andrew Laughlin 提醒公眾：「在日常使用 AI 搜尋時，魔鬼藏在細節裏。」 他建議用戶在將 AI 用作重要參考工具時，必須採取以下五項安全措施：
問題定義清晰： AI 仍在學習如何解讀提問（Prompt），用戶必須在問題中清楚指明特定的地域或法律背景，例如「只針對香港法律」或「英國英格蘭和威爾斯地區」。
提問反覆修正： 如果第一次答案不夠全面或清晰，應繼續以對話形式修正問題，迫使 AI 提供更精確的資訊。
強制要求來源： 由於部分 AI 引擎會使用不可靠的來源，甚至會產生幻覺來「編造」來源，用戶應主動要求 AI 顯示其引用來源，並自行核實，或指示它僅使用可信賴的來源。
獲取第二意見： 始終將 AI 視為單一意見。在採取行動前，應嘗試向兩到三款不同的 AI 工具發問，以獲取一系列的答案進行比較。
專業人士不可替： 對於法律、醫療、重大財務決定等涉及嚴重後果的複雜問題，絕對不能以 AI 建議取代專業人士的意見。
