AI看了10萬次世界盃後,預測巴西將捧起隊史第六座冠軍獎盃,奪冠率高達25%
世界盃賽程來到第11天。
相信昨晚阿根廷的球迷都捏了把小汗,雖然整場下來阿根廷全場圍攻,共計23腳射門,但錯失了太多機會,包括梅西的點球,但好在下半場攻勢迅猛在開場拿下1球後乘勝追擊,最終2-0擊敗波蘭隊。
本場比賽也使得梅西超越馬拉多納,成為阿根廷歷史世界盃出場最多的球員。
小組賽繼續爆冷。在D組最後一輪比賽中,突尼西亞隊以1:0戰勝開場派出非主力陣容的法國隊,但位列小組第三無緣小組出線,法國隊以小組頭名身份晉級16強。
雖然本屆世界盃進行到此尚未過半,但關於本屆世界盃冠軍的預測卻早早拉開了序幕。
會是傳統強隊巴西法國?還是有黑馬殺出?
章魚保羅光榮退休後12年,可能章魚哥自己也沒想到,自己的衣缽竟然被AI繼承了。
讓我們來看看AI對於本屆世界盃冠軍的預測是怎樣的吧~
對模型和資料庫進行最佳化
艾倫圖靈研究所(The Alan Turing Institute)的三位研究員Nick Barlow、Jack Roberts和Ryan Chan開發了一種統計模型。
該統計模型基於2018年一個衍生於《英超范特西》的模型AIrsenal,而AIrsenal又借鑑了Dixon和Coles於1997年推出的足球預測經典模型。
經典模型主要從球隊攻擊強度、防守強度和主場優勢出發,使用貝葉斯統計計算比賽中最有可能得分獲勝的球隊。
為了讓AIrsenal在預測國際比賽結果上更有參考價值,研究人員引入了不同洲的相對實力參數。
除此之外,研究人員在訓練模型時也採用了更為全面的資料庫。
由 GitHub使用者martj42編制的資料庫 記錄了自1872年以來每場足球比賽的詳細結果。資料把比賽的權重也做了一些區分和排序,比如 世界盃 正賽 (2002年之後)和近期比賽要依次大於洲際錦標賽、預選賽和友誼賽。
GitHub連結: https://github.com/martj42/international_results
研究員還將FIFA官方排名輸入到模型中,以提供對球隊表現的最新估計。
今年冠軍究竟會花落誰家?
在100,000次模擬之後,AI也給出了自己的預測。
毫不意外,巴西隊一如既往成為第一大熱門,在25,000次預測中都登頂了本屆世界盃,奪冠率高達25%。
緊隨其後的是傳統強隊比利時和阿根廷,奪冠率達到了18%和13.5%。
如果你覺得現在談決賽和冠軍還有點太遙遠,我們來看看近期的比賽結果預測。
就11月29日英格蘭對陣威爾士的比賽來說,AI給出的結果是,英格蘭有大約80%的機率會從小組賽中出線,進入1/4決賽或決賽的機率則為60%,而最終奪冠的機率只有7%。
反觀威爾士,威爾士隊有50%的機率會出線小組賽,但進入決賽的機率只有2%,奪冠機率則只有0.5%。
就本屆世界盃目前表現來看,英格蘭隊1勝1平積4分,暫列小組第一。首輪6-2輕鬆擊敗伊朗後,卻在次輪對陣美國時表現平平。總的來看兩輪比賽下來,英格蘭還是比較順,體能消耗也不是很大,但問題是球隊的陣容還沒有面臨真正的挑戰。在淘汰賽前的最後一場小組賽,英格蘭肯定需要更多的精力去面對比賽。而威爾士整體實力雖有貝爾和拉姆塞鎮場子,但其他人因為年齡和傷病,實力明顯不如從前。
同時從兩隊交手103次的歷史成績來看,英格蘭68勝21平14負佔據了絕對優勢。
而最終結果來看,英格蘭以3:0的大勝為小組賽收官,同時他們也以2勝1平的戰績排名B組第一,攜手1勝2平的美國隊出線。
巴西隊深受AI歡迎
除了艾倫圖靈研究所的模型之外,還有很多預測模型都對本屆世界盃給出了自己的預測。
比如博主@JackCuiAI在統計了 1872年-2022年間的國際足球比賽資料和1922年到2022年間的國際足聯世界排名資料,並對這些資料進行了分析,提取了影響比賽的包括排名、主客場、射門次數、撲救次數、最終比分等關鍵特徵之後,使用整合學習梯度提升決策樹Gradient Boosting Classifier給出了自己的預測。
在前四場卡達-厄瓜多、英格蘭-伊朗、荷蘭-塞內加爾和威爾士-美國比賽中,AI給出了與實際結果完全一致的預測,甚至包括小組賽比分和各隊積分。
根據AI預測,本屆世界盃8強將會是荷蘭、阿根廷、西班牙、巴西、英格蘭、法國、比利時、葡萄牙,最終決賽會在巴西和葡萄牙之間展開,而最終巴西將捧起隊史第六座世界盃冠軍獎盃。
看來,巴西隊果然是深受AI歡迎。
來自多特蒙德工業大學、慕尼黑工業大學、盧森堡大學等高校的聯合研究團隊也結合多個表示球隊實力的統計模型與球隊結構(市場價值或歐冠球員數量)和原籍國社會經濟因素(人口或國內生產總值)等資訊,給出了世界盃預測。
巴西隊以15%的奪冠率高居榜首,進入決賽的機率也有23.5%;阿根廷緊隨其後奪冠概11.2%;奪冠熱門第三為荷蘭隊,奪冠率為9.7%; 德國、法國位列第四和第五。
研究團隊此前的預測的精準率都相當高,比如2008年和2012年的歐洲盃冠軍、2010年的世界盃冠軍等。
但是多特蒙德工業大學統計學教授格羅爾也表示,預測可能存在錯誤,否則足球比賽將變得非常無聊。
“我們提供的只是機率,而不是確定性,15%的奪冠機率也意味著85%的失敗機率。 ”
是啊,球場上的不確定性才是最吸引人的,你說對吧梅西。
相關報導
https://www.turing.ac.uk/blog/can-our-algorithm-predict-winner-2022-football-world-cup
本文來自微信公眾號“巨量資料文摘”(ID:BigDataDigest),作者:Caleb,36氪經授權發佈。