75,000 個即場足球預測:如何同時看比賽、球隊與球員
- 5月19日
- 讀畢需時 5 分鐘
足球比賽的即場預測,最常見是問「主隊勝、和局、客隊勝」機率如何變化。但對 broadcast、球隊分析、交易風控或球員 props 市場來說,更細的問題往往更有用:某球員全場會有幾多次 attempted passes?某隊最後會有幾多次 shots?紅牌後,兩隊的 corners、fouls、yellow cards 預測是否同步改變?
Horton 與 Lucey(2025)提出一個大型即場足球預測模型,用 axial transformer neural network 在比賽進行中反覆更新預測。模型不是只預測單一結果,而是同時在 game-level、team-level、player-level 做多任務預測;作者指出,每場比賽大約會產生 75,000 個 live predictions,並可在一般 CPU 上低延遲推論。
本文重點
這篇文真正想解決的,是足球即場預測的「規模」與「一致性」問題。傳統 live win probability 只回答比賽結果;很多 player props 或 team totals 則需要分開建模,容易出現互相矛盾的預測。
作者的做法是把球員、球隊、比賽狀態與賽前 context 放入同一個 transformer backbone,讓模型在時間維度學到比賽如何演化,也在 agent 維度學到球員與球隊之間的互動。這對足球市場尤其重要,因為一次入球、紅牌或換人,不只改變勝率,也會同時改變傳球、射門、犯規、角球與牌數等多個 action totals。
一、為何即場 player-level forecasting 難做?
在一場足球比賽中,每個球員的最終數據都受多種因素影響。以 successful passes 為例,預測某球員全場成功傳球數時,模型至少要考慮:
該球員當前已完成幾多次傳球;
隊友與對手的實力、踢法與位置;
當前比分、剩餘時間、紅牌狀態與比賽節奏;
該球員被換走的風險;
最近幾分鐘的 momentum,以及重大事件後的結構變化。
更麻煩的是,不同預測之間應該要互相一致。球員 shots on target 不可能長期高於 shots;球隊 assists 與 goals 應該有合理關係;一支球隊若明顯佔優,通常會有較多 passes、shots 與 corners,亦可能令對手的 fouls 和 cards 分布改變。
所以這不是「替每個市場訓練一個模型」就能乾淨解決的問題。它需要一個可以共同吸收 game state、agent interaction 與 temporal dynamics 的架構。
二、模型怎樣組織資料?
論文把每場比賽視為一個 training example。輸入分成多種 modality:
Player live features: 球員位置、所屬球隊,以及比賽中已累積的 actions。
Player strength features: 球員賽前能力與風格摘要,例如過去幾場的 actions 均值、近期最高 fouls conceded、休息時間、旅行距離等。
Team live / strength features: 球隊層面的即場累積數據與賽前強度特徵。
Game state features: 當前事件類型、比賽時間、事件位置等。
Game context features: 比賽所在賽事、開賽時間等背景資訊。
一個重要設計是:特徵不重覆複製到每個球員身上,而是按 player、team、game、pre-game / in-game 的自然層級放入相應 tensor。模型再靠 attention 去學哪些 modality 對哪些預測有用。
三、Axial Transformer 的角色
Transformer 的核心是 attention,但如果把所有球員、球隊與時間點攤平成一條長序列,計算量會很快變大。這篇文使用 axial attention:把資料看成一個 grid,一個方向是時間,另一個方向是 agents。
時間維度 attention: 每個 agent 在當前時間點,只能 attend 到自己過去的狀態。這讓模型學到 momentum、疲勞、入球後節奏變化、紅牌後調整等 temporal dynamics。
Agent 維度 attention: 同一時間點內,球員、球隊與 game state 可以互相 attend。這讓模型捕捉「其他球員或對手狀態如何影響此球員預測」。
作者提出的變體,不是把 row attention 和 column attention 順序堆疊,而是把兩者的輸出加權相加,並指出這個形式可視為某種 masked sequential self-attention 的等價實作,但計算複雜度較低。對 live system 來說,這點很實際:模型需要在比賽事件觸發後快速更新,而不是離線慢慢算。
四、預測甚麼?
模型同時預測球員、球隊與比賽層面的最終 totals。文中重點 action 包括:
goals、assists、shots、shots on target;
corners、attempted passes、accurate passes;
tackles、fouls、yellow cards、red cards、own goals;
以及 game outcome 等整體結果。
作者描述的 live pipeline 是事件驅動式:當 foul、corner、goal 等 key event 發生,系統會組裝當前 features、讀取歷史 context,然後把結果送入模型,再把預測輸出到後續 messaging system。每場約 150 個時間點,每個時間點約 505 個 predictions,量級約 75,000 predictions per game。
五、實驗設計與結果
實驗資料包含 62,610 場、來自 28 個 competitions 的比賽。訓練集使用 2016–17 至 2023–24 八個賽季,共 58,501 場;測試集是 2024–25 賽季截至 2024 年 12 月 15 日的 4,109 場。
模型選擇方面,最佳配置使用 latent dimension 128、4 層 transformer layers、learning rate 0.0003,訓練約 150,000 steps,單張 NVIDIA A10 GPU 約 15 小時。
由於缺少完全對應的 baseline 與公開 in-game player-level betting data,作者主要看兩件事:一是 calibration 是否合理,二是 ablation study 能否證明架構各部分真的有貢獻。
結果顯示,模型在多數 target 上有不錯 calibration;較弱的地方主要是 support 不均的 target,例如 red cards、own goals 這類極低機率事件,以及 attempted / accurate passes 這類取值範圍很大的高頻事件。Ablation study 則顯示,移除 agent attention、temporal attention 或 pre-game context,整體 log-probability 都會變差;作者的 axial attention 變體亦優於典型 stacked axial attention。
六、對足球數據與市場的啟示
這篇文對足球 AI 的價值,不只是「又一個 transformer」。它把 live forecasting 從單一勝率推到更細的 multi-agent、multi-target、multi-time-step 層面。
對球隊分析來說,這種模型可用來看紅牌、換人或戰術變化對球員 action totals 的連鎖影響。對 broadcast 來說,它可支援更即時的敘事:不只是「勝率升了」,而是「某球員傳球、某隊射門與角球預測如何同步變化」。
對 betting / trading 系統來說,這類模型尤其貼近 player props、team totals、corners、cards 等市場的自動化 pricing 需求。不過要注意,論文展示的是預測與校準能力,不等於直接提供可交易 edge;真實落地仍要處理 bookmaker margin、延遲、限額、資料品質與市場回饋。
七、小結
文章的核心貢獻,是用一個 axial transformer 架構,在足球比賽中同時處理時間演化、球員/球隊互動與多任務輸出。模型能在大規模比賽資料上訓練,並以低延遲產生大量 live predictions。
如果把足球即場市場看成一個持續更新的狀態估計問題,這篇文提供了一個很清晰的工程方向:不要只建一個勝率模型,而要建立能共同理解 match、team、player 三個層級的 forecasting backbone。
Reference
M. Horton and P. Lucey. Large-Scale In-Game Outcome Forecasting for Match, Team and Players in Football using an Axial Transformer Neural Network. arXiv:2511.18730v1 [cs.LG], 24 Nov 2025. https://arxiv.org/abs/2511.18730
A. Vaswani et al. Attention Is All You Need. Advances in Neural Information Processing Systems, 2017.
J. Ho, N. Kalchbrenner, D. Weissenborn and T. Salimans. Axial Attention in Multidimensional Transformers. arXiv:1912.12180, 2019.
P. Robberechts, J. Van Haaren and J. Davis. A Bayesian Approach to In-Game Win Probability in Soccer. KDD, 2021.
I. Simpson, R. J. Beal, D. Locke and T. J. Norman. Seq2Event: Learning the Language of Soccer Using Transformer-based Match Event Prediction. KDD, 2022.
M. Horton and P. Lucey. Stats Perform / Opta football event data context, as discussed in the paper.
原文 Paper




