亞馬遜員工把「LLM結合快打旋風」！測試全球14個LLMs誰最強第一名是這1家新創公司的模型

周育信

2024年4月9日上午6:10

一位來自亞馬遜（Amazon）的員工近日將一項大型語言模型（以下簡稱LLM）開源專案結合《快打旋風》遊戲，且測試全球當前14個LLM哪一個能力最強！奪下第一名的模型隨即受到矚目。

這名亞馬遜員工名為Banjo Obayomi，他取用的開源專案名為「LLM Colosseum」，是由兩位工程人員Stan Girard與Quivr Brain所開發，最初這項開源專案推出時，目的即是期望透過LLM來更精準控制遊戲角色對決。

而Banjo Obayomi將此開源專案用來測試14個LLMs，測試過程中，各個LLM會依據遊戲當前設定好的場景、氛圍文字描述來決定角色的下一步行動，包含相互接近、後退或執行波動拳或升龍拳等技能。

角色的每一個動作決策都得以從中看出LLM的理解能力和戰略預測成效。

<cite>在LLM Colosseum測試過程中，可從遊戲角色的攻守策略看出每個模型的理解和反應能力。（圖／翻攝自YT／DataOpsDC）</cite> — 在LLM Colosseum測試過程中，可從遊戲角色的攻守策略看出每個模型的理解和反應能力。（圖／翻攝自YT／DataOpsDC）

經過測試後，最終14個LLMs中脫穎而出的，是claude_3_haiku！共計參與了314場比賽，而測試結果也顯示，較小型的LLM能做出更快速動作，招式較多樣，以速度和反應能力取勝。

<cite>Stan Girard即是LLM Colosseum開源專案的開發者。（圖／翻攝自X／Stan Girard）</cite> — Stan Girard即是LLM Colosseum開源專案的開發者。（圖／翻攝自X／Stan Girard）

最後，不得不特別介紹，冠軍Claude 3 Haiku模型即是由新創公司Anthropic所推出的模型！

Anthropic所推出的Claude 3系列目前被封為「全球最強AI模型」，且Anthropic公司自信斷言，這是當前速度最快、最強的模型，相較該公司另外推出的Opus和Sonnet版本，Haiku是其中最為輕巧且迅速的，同時成本也是最低的。

延伸閱讀：
Claude 3是什麼？新創公司Anthropic曝「測試手段被它抓包」記者拜訪研發團隊揪1詭異現象

更多風傳媒報導

三立新聞網 setn.com
余天女婿涉詐　沈富雄爆驚人內幕：幸虧余家還有一個很聰明的人
政治中心／張家寧報導資深藝人、民進黨籍前立委余天的女婿陳鑒（Gary），日前涉嫌遭詐騙集團吸收淪詐團車手頭，依詐欺罪嫌移送檢方聲押禁見獲准。對此，前立委沈富雄則在節目上表示
Reactions68
今日新聞NOWnews
女婿涉詐！余天失蹤2孫找到了　最新狀況曝
[NOWnews今日新聞]余天女婿陳鑒因勾結詐騙集團擔任車手被捕，余天今（3）日受訪承認，後悔把女兒余苑綺交給陳鑒，打算把外孫與孫女接回家照顧，但疑似找不到人，有請社福人員幫忙。新北社會局稍早表示，社...
Reactions34
三立新聞網 setn.com
湯姆斯盃／台灣男團創最佳紀錄　選手們跨欄衝進場、看轉播太激動閃到腰
記者張沛嘉／綜合報導 2024湯姆斯盃男子團體賽，台灣男團派出最強陣容順利挺進8強，3日對決強敵丹麥，台灣男團靠著一哥周天成、「黃金男雙」王齊麟、李洋以及近況絕佳的李
Reactions2
CTWANT
余苑綺老公遭逮　余天揭過去異樣：綺綺常為「這件事」生氣
[周刊王CTWANT] 近期新北市一位民眾報案，表示自己遭詐騙集團騙了千萬元。警方獲報後聯手被害人，事先在面交地點埋伏，並循線逮捕面交的車手。而該名車手落網後，供出了負責上頭回收贓款的人及地點。之後警方前往現場埋伏，豈料竟抓到陳鑒。陳鑒被捕後坦承犯案，後續被移送新北地檢署，目前...
Reactions81
TVBS新聞網
余天切割女婿！震怒轟「判刑久一點」：可惡，什麼詐騙集團
余天和李亞萍愛女余苑綺於2022年8月癌症病逝，她的老公Gary（陳鑒）扶養一雙兒女，未料今（2）爆出Gary是「車手頭」，被新北市海山分局依詐欺罪嫌逮捕，當場在Gary身上起出200餘萬鉅款。對此余天震怒，他向《TVBS新聞網》表示絕不會管Gary，直呼：「最好判久一點，可惡，什麼詐騙集團。」大義滅親，希望從重量刑，余天強調Gary已一個多月沒見。
Reactions209
三立新聞網 setn.com
劉德華認了唯一絕交「男藝人」是他！　遭疑「留宿朱麗蒨」惹怒華仔
娛樂中心／綜合報導62歲天王劉德華出道超過40年，除了演技精湛，親民的作風也令他圈粉無數，且幾乎沒有負面新聞，脾氣又相當溫和，被譽為「零負評男神」。沒想到劉德華曾上《康熙來了》節目
Reactions14
三立新聞網 setn.com
獨家／搶小孩大戰開打！余天出手「急求救律師」：不惜一切帶孫回家
記者蔡維歆／台北報導余天與李亞萍女婿、已逝女星余苑綺丈夫Gary（陳鑒），昨驚傳疑似擔任詐騙集團車手遭收押禁見，原本余天今天要把孫女孫子接回家，結果發現小孩兩天沒上
Reactions20
鏡新聞
余祥銓露面談姐夫Gary涉詐　透露余苑綺留下千萬遺產恐遭扣
藝人余天、李亞萍已故女兒余苑綺丈夫Gary陳鑒涉嫌當詐騙集團車手頭，2日已遭法院裁定收押禁見，今日上午驚傳余天找不到孫子孫女，且李亞萍聯繫Gary媽媽對方也表示不知道小朋友被帶到哪裡，余祥銓今天現身《chill chill 懂事長》錄影，恰逢節目開棚記者會，面對大批現場等候的記者態度直接，未拒絕受訪採訪。
Reactions29
三立新聞網 setn.com
孫女孫子突失蹤！余天「急電聯女婿母」揭最新現況：她也不知小孩在哪
記者蔡維歆／台北報導前立委余天女婿陳鑒（Gary）昨驚爆與詐騙集團勾結，最後昨被警方依詐欺罪嫌移送新北地檢署收押。余天原本今天打算把孫子孫女帶回家照顧，無奈卻找不到
Reactions24
EBC東森新聞
東北季風要增強了「低溫探15度」時間點曝光
東北季風要增強了「低溫探15度」時間點曝光
Reactions12
CTWANT
余祥銓痛批姊夫「丟臉可恥」！　爆曾跟「李亞萍討錢」私下行徑全曝光
[周刊王CTWANT] 據了解，新北警方日前接獲詐欺報案，並使出將計就計和被害人合作，30日與車手相約在住家面交，並當場順利逮到車手，車手無奈之下又供出交付現金給「收水手」的地點，於是又順利在在新站路捷運聯通道抓到人，沒想到此人竟是余苑綺老公陳鑒。對此，余天則無奈表示毫不知情，並...
Reactions68
壹蘋新聞網
余天等吃「徐巧芯套餐」？徐巧芯出聲了：一記大大的迴力鏢...
【王怡人／綜合報導】余天愛女余苑綺2022年8月癌症病逝，她的丈夫老公陳鑒日前被新北市海山分局依詐欺罪嫌逮捕，已遭收押。有人嘲諷，近來國民黨立委徐巧芯因為大姑涉詐而被圍剿，現在就「坐等余天吃徐巧芯套餐呀？」今天，徐巧芯聽見了，她在臉書發出長文評論此事。
Reactions270
民視
余天女婿涉詐案！徐立委見獵心喜？邱明玉：怎麼比？
論壇中心／綜合報導民進黨前立委余天的女婿陳鑒昨日因擔任詐騙集團收水房角色被收押，余天痛罵女婿「不要臉」，更強調，「該關多久就多久」，同樣因大姑夫婦捲入詐騙案受牽連的國民黨立委徐巧芯，今天一早受訪時笑得很開心，還問媒體，「我現在不會看起來太囂張吧，還好吧表情管理還可以吧？」接著先是表明自己相信余天不知情，然後痛批綠營一整個禮拜加諸在她身上，不合比例的攻擊有多麼荒謬。對此，資深媒體人邱明玉在《台灣向前行》節目上表示，「我知道很多藍營，尤其徐巧芯的支持者會很開心，因為現在綠營也出事，但我說難聽一點，這兩個人怎麼比，我覺得是香腸去比雞腿啦，因為第一個，余天大哥現在已經完全沒有任何公職，余天大哥現在跟大家一樣，就是一介平民，台灣有多少個前立委，前立委在政壇上的影響力，跟現任的立委、當紅炸子雞徐巧芯要怎麼比？如果要比照，那是要叫余天大哥下台嗎？他人家都已經不是立委了，也不是新北市黨部主委，就是一個平民老百姓。」余天女婿涉詐案讓徐巧芯滿血復活，猛批綠營雙標，民進黨立委黃捷就酸，余天現在是平民，但徐巧芯是立委，不然徐巧芯先公開辭掉立法委員，就請余天辭掉新北市民，公平吧？
Reactions254
民視
地震頻傳台灣住哪最安全？3大地質專家認證「這3區」為天選之市
生活中心／巫旻璇報導自4月3日花蓮發生規模7.2強震後，迄今滿一個月台灣連震1300起以上，4月27日凌晨2點21分更發生芮氏規模6.1的地震，不尋常的地震，讓不少民眾相當擔心，因此有關「台灣哪裡最不怕地震」的相關話題再次發酵。對此，台灣三大地質專家陳文山、郭鎧紋、李錫堤教授一致點出台灣「這3個地方」斷層較少是最安全的區域。
Reactions191
CTWANT
台灣有高達36條斷層「住哪裡安全」　專家點名這3個區域：堅如磐石
[周刊王CTWANT] 近日民視的《新聞觀測站》節目就邀來台大地質系名譽教授陳文山、前氣象局地震測報中心主任郭鎧紋和中央大學應用地質研究所教授李錫堤，3 位專家指出，當有較大規模地震發生時，林口、桃園的台地因有堅實地盤，傷害會比較小，反觀台北盆地的震動則會比周邊大。除此之外，3位專...
Reactions93
三立新聞網 setn.com
點名民進黨反被酸「我看起來像余天嗎？」徐巧芯17字回應：確實不像
娛樂中心／徐珮華報導民進黨前立委余天女婿Gary（陳鑒），昨（2）日驚爆涉入詐騙車手案，目前被依詐欺罪嫌移送新北地檢署收押。先前捲入大姑洗錢風波的國民黨立委徐巧芯，今日也把
Reactions91
CTWANT
這天鋒面逼近「全台變雨區」　下波低溫下探1字頭
[周刊王CTWANT] 根據氣象署表示，4日的天氣跟今天相似，環境偏東南風，僅基隆北海岸、東半部有局部短暫陣雨，其他地區為多雲到晴，午後北部和各地山區有局部短暫雷陣雨，且有局部較大雨勢。至於周日的天氣則會有變化，氣象署指出，隨著鋒面接近水氣增多，周日天氣較不穩定，西半部一早就有局...
Reactions35
TSNA
PLG》夢想家超感人！　連布依德都想無條件歸化
福爾摩沙台新夢想家洋將除了吉爾貝克（Brandon Gilbeck）與麥卡洛（Chris Mccullough）有歸化意願外，夢想家董事陳立宗今天又在個人社群媒體透露，連布依德（Julian Boyd）都想成為台灣人，甚至願意無條件歸化！
Reactions42
新頭殼
｢柯文哲曉得2026完蛋、2028也廢了｣沈富雄：搔頭皮裝可愛不見了
[Newtalk新聞] 京華城改建案、北士科設定地上權案等爭議持續延燒，近日遭民眾告發，台北地檢署2日表示，檢察官已分他字案，並指揮廉政署北調組偵辦，案由為貪污治罪條例，民眾黨主席、前台北市長柯文哲列被告。對此，前立委沈富雄在節目上指稱，柯文哲如今已經志不在2026年，他曉得「2026年完蛋，2028年也廢了」。柯文哲台北市長任內的京華城容積率暴增、北投士林科技園區地上權招商案近期頻遭質疑，被民眾告發涉貪污，並遭台北地檢署列為被告。柯文哲3日回應，要辦的明明是台智光案，為什麼最近一個月開始討論京華城、北士科，是典型的「圍魏救趙」，因為台智光「藍綠都有，辦下去會死人」，大家都辦不下去，就拿這2案出來潑糞。沈富雄3日在政論節目《少康戰情室》中分析，柯文哲一直給人很摳、很節省的人設，因此很難想到柯文哲會走到如今的局面。柯文哲平時做的還蠻正直的，但當他碰到非常有錢的財團「骨頭可能就矮半截」。柯文哲如今已經志不在2026年，沈富雄說：「他曉得2026年完蛋了，2026年如果選不好，2028年也廢了、也吹掉了。」沈富雄指出，柯文哲如今已經忘掉騎腳踏車、去立法院、去群賢樓，他已經沒有興趣，因
Reactions85
華視
追到加拿大！　美鷹會.華青幫聯手追債貴婦奈奈
部落客貴婦奈奈和男友，以及男友父母，涉嫌詐欺吸金十億，潛逃加拿大，被北檢發布通緝！逃亡六年後，男友的名醫父親黃立雄，主動和調查局聯繫，表示被黑幫追債追到加拿大，願意回台接受調查；目前黃立雄夫妻檔，已經...
Reactions248

其他人也在看