AI也有幻覺！檢測各家AI模型「幻覺度」 ChatGPT「3%錯誤」…這家巨頭竟然墊底

周刊王CTWANT |廖梓翔

2023年11月18日上午1:54

[周刊王CTWANT] 隨著生成式聊天機器人CahtGPT在全球的爆火，AI機器人可以說是開始逐步進入人們的日常生活中，不少人都會開始使用AI機器人來輔助自己的工作。但現在就有公司發明檢測AI，專門針對各家廠商的AI機器人進行內容「正確性」上的檢測，並且將各家機器人「幻覺度」進行排名，其中冠軍就是大家所熟知的ChatGPT，而排名最末的竟然是Google所推出的PalM 2。

根據《toms hardware》報導指出，先前就有第三方研究機構在研究各家AI機器人之後，確定了AI機器人會有「幻覺（hallucinations）」的產生，AI機器人會憑空編造一些不存在的資訊來回答。

先前其實就有傳出類似的案例，美國紐約律師事務所「Levidow, Levidow & Oberman」施瓦茨（Steven A Schwartz）就在一次訴訟中，提出由ChatGPT所撰寫的文件，而其中引用了6起步存在的案件當作判例，結果遭到對手公司法律團隊識破，更被法院要求解釋。

而且根據研究人員的研究，他們發現短時間內似乎無法解決AI機器人產生幻覺的問題。研究AI科技的布朗大學教授文卡達蘇巴馬尼安（Suresh Venkatasubramanian）也表示，與其說AI機器人會虛構不存在的事情，還不如說，AI機器人所產生的回答比較像是小孩子隨口說出的故事，因為不懂得事情的真偽。

為了釐清AI幻覺度的問題，新創公司Vectara就進行了一項研究，以各家廠商推出的AI機器人進行法律方面的測試，Vectara提供了800多份文件給AI，接著要求這些AI依照要求來進行文件的內容摘要，最後將AI生成的結果輸入到自己研發的檢測AI中。

Vectara驗證各家AI準確度的排名。（圖／翻攝自Vectara GitHub）

其中，GTP 4與GTP 4 Turbo的正確性為97%、幻覺度3%；GPT 3.5 Turbo的正確性為96.5%、幻覺度3.5%；Meta推出的Llama 2 70B正確性為94.9%、幻覺度5.1%；Llama 2 7B正確性為94.4%、幻覺度5.6%。其餘各家的AI機器人正確度均有90%以上，幻覺率也是10%以下。

但在其中，Google所推出的PalM 2，其正確率為87.9%，幻覺率為12.1%；而PalM 2 Chat的正確率為72.8%，幻覺率為27.2%。

原始連結

EBC東森新聞·
周五再放一天？12縣市已達停班停課標準
周五再放一天？12縣市已達停班停課標準
Reactions92
三立新聞網 setn.com·
又在信義區！孫安佐竟與混血女星當街打起來　自豪有這項「超能力」
娛樂中心／綜合報導狄鶯與孫鵬的兒子孫安佐在泰國脫序行為之後，2個多月來各種紛爭再度成為話題人物，還曾因在信義區展示有攻擊性的武器被送入警局。台英混血歐斯卡（Oscar）在台北101
Reactions199
引新聞·
小吳終於道歉了！十盛標示不實　哽咽認了：早知道有奶精
（記者劉雅文／綜合報導）百萬YouTuber小吳和網紅紀卜心，共同創立的手搖飲品牌「十盛熟成奶茶專賣店」，日前 […]
Reactions291
中天新聞網·
美媒評選奧運開幕式各國出場團服　盛讚中華隊：把時尚帶進巴黎
2024巴黎奧運開幕式已在稍早舉行完畢，本屆奧運也是史上首次在「水上」的戶外開幕式，各國代表隊選手進場後，隊服也成為外界矚目焦點。其中美國媒體《雅虎體育》就對中華隊的出場服裝稱讚滿滿，「中華隊將時尚帶到巴黎！」
Reactions13
中天新聞網·
高雄被颱風重創卻找不到黃捷！本人出面回應網友反揪疑點：出國玩不敢說？
凱米颱風直撲台灣，而南台灣的台南、高雄等地更是被暴雨襲擊，多處出現嚴重淹水，然而此時身為高雄立委的黃捷卻不見人影。對此，黃捷本人回應「自己的團隊」從早到晚奔波，對高雄噴政治口水「大可不必」。然而網友卻發現更多疑點，怒嗆質疑黃捷到底人在不在台灣？
Reactions873
TVBS新聞網·
台北風雨小「放颱風假賺爛」？專家揭關鍵打臉：沒這事能這麼和平
颱風凱米直撲台灣，全台多個縣市一連放了2天颱風假，然而今（25）日早有民眾疑惑「北北基桃這樣放颱風假是賺到了？」、「北部風雨那麼小放什麼颱風假？」但氣象專家點出1關鍵，直言若沒發生這件事，「北部還能那麼和平嗎？」
Reactions244
風傳媒·
「高虹安是小白兔闖入政治叢林」　游盈隆預言結局：可能還有變化
新竹市長高虹安於立委任內涉詐領助理加班費案，一審判處7年4月，職務由副市長邱臣遠代理，並宣布退出民眾黨。對此，...
Reactions112
三立新聞網 setn.com·
2親人都罹大腸癌！婆婆「剩菜加1物」吃出癌　譚敦慈揭飲食3地雷
生活中心／張家寧報導大腸癌是近幾年台灣癌症的頭號話題，許多名人也都曾因該疾病身亡，對於人體健康的影響程度不容小覷，外界提到大腸癌大多會聯想到攝取加工食品、抽菸嗜酒等壞習慣。
Reactions21
中央社·
王冠閎分享奧運接駁車慘況須席地坐盼團本部安排
巴黎奧運今天舉行開幕式，接駁車問題仍然無解，台灣游泳好手王冠閎、韓安齊分享，接駁車大誤點、開錯路，加上游泳項目人數多，甚至只能席地而坐，也盼比賽日當天團本部能安排接駁。
Reactions55
三立新聞網 setn.com·
強颱釀高雄淹水！陳柏惟怒轟酸民「對同胞無情、程度差」：高雄人沒欠你
記者楊士誼／台北報導颱風「凱米」侵台，造成多起災情，25日颱風出海後帶來的西南氣流造成中南部多處淹水，高雄更降下超過2009年莫拉克颱風降雨量的超級大雨，造成多處淹水、滯洪池全滿，
Reactions817
華視·
行李等2小時還沒到氣炸　華航主管當眾下跪任罵
凱米颱風雖然已經離開台灣，但影響還在！昨(26)日凌晨華航有兩個航班延遲抵達桃園機場，三、四百名乘客在行李轉盤，又等了兩個小時，氣到對地勤人員破口大罵！華航主管緊急出面，安撫乘客的情緒，甚至還當眾下跪...
Reactions12
新頭殼·
凱米前腳剛走又有颱風? 菲律賓附近恐有熱帶低壓生成下週逼近台灣
[Newtalk新聞] 凱米颱風暴風圈今（26）天凌晨脫離台灣本島。中央氣象署最快在今天上午8點半解除海上颱風警報，颱風尾夾帶的豐沛雨量預計會持續到今晚才會趨緩；而凱米前腳才剛走，恐怕又有颱風成形，週末菲律賓東方海面可能會有熱帶低壓生成，預計將朝台灣東南海面前進，下週一到四對台灣會影響。氣象署今天凌晨2點半解除凱米颱風本島警報，凱米颱風今天清晨5點的中心位置在馬祖的西南西方約170公里之處，以每小時16轉12公里速度，向北北西轉西北進行。氣象署預計在上午8點半解除海上警報。中央氣象署預報員陳姵安表示，凱米颱風尾帶來的豐沛雨量預計在今晚就會趨緩。陳姵安提到，週六風向改為東南風，屆時東部、屏東將會出現風場幅合效應，將會有水氣影響。另外，週末在菲律賓東方海面，可能會有熱帶低壓生成，若生成將朝台灣東南側海面前進，下週一到週四對台灣有影響。不過，目前歐洲、美國對熱帶低壓的強度預設仍有分歧，還要持續觀察。此外，氣象粉專「台灣颱風論壇｜天氣特急」25日深夜發布消息指出，目前在菲律賓東南方有一個熱帶擾動（tropical disturbance）95W正在發展，綜合歐美德及幾個AI模式大致都認為
Reactions60
Yahoo奇摩運動·
奧運》戴資穎、孫振掌旗率隊征戰花都開幕式Lady Gaga、席琳狄翁接連開唱同慶
2024巴黎奧運會於台灣時間27日凌晨1點30分正式開幕，中華代表團搭乘第74艘船進場，掌旗官由台灣羽球一姊戴資穎及霹靂舞一哥孫振擔當，代表團共有21位中華健兒、12位教練、6位行政人員參與開幕儀式，巴黎現場雖然下起不小的雨勢，但仍舊抵擋不了大家的熱情，每位選手皆用力揮舞手上會旗，透過轉播鏡頭讓世界看到台灣。
Reactions56
三立新聞網 setn.com·
他喊1縣市完虐北中南：最宜居城市！網戰翻：天然災害真的相對少
鄉民中心／梁雪婷報導台灣各縣市因地理位置、環境設備等，遇到自然災害的損害各有不同。日前，就有網友指出，桃園甚少傳出自然災害的災情，也沒有台北土壤液化的問題，空氣也比
Reactions24
三立新聞網 setn.com·
認屍案傳回泰國　唐治平親戚不捨出手了！金援內幕曝光
記者鍾智凱／綜合報導唐治平認母案受到高度關注，日前他受訪時表示：「既然檢警堅持要我認，我就認。」先前他曾指出母親會有百萬保險金部分，他說要拿到母親死亡證明才能領，且
Reactions101
中廣新聞網·
揭發高虹安涉貪　國民黨前議員林耕仁「16字」曝心內話
新竹市長高虹安涉貪案一審判有罪，內政部宣布高虹安停職，高虹安表態將會提出上訴。揭發高虹安涉貪的國民黨前新竹市議員林耕仁今（26）天透過臉書回應：「天道輪迴、舉頭三尺、尊重司法、嚴謹判決」。高虹
Reactions177
TVBS新聞網·
根本不在台灣？黃捷發文嗆「團隊在奔波」網揪疑點：出國玩不敢說
凱米颱風尾橫掃台灣中南部造成嚴重災情，高雄慘淹大水淪為重災區。然而高雄立委黃捷卻被質疑未被到場勘災，國民黨智庫副執行長凌濤更是發文「急尋黃捷」。對此，黃捷今（26）日發文反擊，只是1句「團隊同仁」在地方奔波，再遭網友揪出疑點，質疑她出國玩不敢說？
Reactions313
FTNN新聞網·
躲股災選「它」！交易量暴增達42萬張　股價逆勢漲2.93%　網喊：歐印
[FTNN新聞網]記者蔡昀庭／台北報導因凱米颱風侵襲，台股休市2天，今（26日）開盤補跌，重挫982點，摜破22000點，最低達到21931.9點，收22,119.21點。股民為躲...
Reactions24
三立新聞網 setn.com·
關鍵4個月！王義川曝新竹企業家「恐逼高虹安辭職」：辭了黃國昌選不了
記者詹宜庭／台北報導新竹市長高虹安被控涉貪助理費46萬餘元，台北地方法院今（26日）一審判決出爐，依貪污罪高虹安判刑7年4月，褫奪公權4年，可上訴；另依地方制度法第
Reactions120
Yahoo奇摩新聞（記者潘鈺楨）·
席琳狄翁回來了！奧運開幕華麗復出「壓軸飆高音」女神卡卡雨中性感獻舞
2024巴黎奧運於台灣時間27日凌晨開幕，演出陣容如同先前外傳，由女神卡卡（Lady Gaga）在塞納河畔表演揭開序幕，席琳狄翁（Celine Dion）壓軸登場，在巴黎鐵塔為開幕式畫下完美句點。
Reactions28

其他人也在看