top of page

xT 模型網格點幾細先夠?彈性與準確度的取捨

  • 5月5日
  • 讀畢需時 5 分鐘

已更新:5月6日

Expected Threat(xT)是足球數據分析中很受歡迎的解釋型模型:它把球場切成網格,估計每個位置在當前 possession 內最終入球的機率,再用動作前後的 xT 差值衡量傳球、盤帶等 on-ball actions 的價值。它比很多黑箱模型容易同教練、球探、分析師溝通,但有一個實務難題:球場網格應該切得幾細?

van Arem、Söhl、Bruinsma 與 Jongbloed 喺 arXiv:2511.09457v1 研究 xT 模型的 flexibility-accuracy trade-off。網格越細,模型越能分辨不同位置與情境;但同一批資料要估計更多 transition probabilities,估計誤差亦會上升。這篇 paper 的目標是把這個取捨量化,並給 practitioner 一條可操作的 rule of thumb。


本文重點

作者從 xT 的 Markov chain 公式出發,推導估計誤差上界,再用 StatsBomb open data 建立大規模 simulation,估計不同 grid size 與 training sample size 下的最大 xT 誤差分佈。

結論可以簡化成一句:不要盲目把網格切得越細越好;應選擇「在可接受誤差下最靈活」的模型。以 scouting 為例,若 maximal model error 要在 90% 機率下低於 0.03,而你有約 2,480,000 個 training data points(約 4 個聯賽賽季),paper 的 rule of thumb 會建議最高用 M = 130,即約 13 × 10 的 grid。


一、xT 的基本想法

xT 把足球控球鏈視為 Markov chain。球場被分成 M 個 states,每個 state 對應持球者所在格子。對某一格 s,xT(s) 表示從這個位置開始,當前 possession 最終入球的機率。

在每個 state,球隊可以直接射門,也可以傳球或盤帶到另一個 state。公式可寫成:

  • xT(s) = P(shot | s) · xG(s) + Σ T(s→s') · xT(s')

其中 T(s→s') 是由 state s 移動到 state s' 的 transition probability。實務上,P(shot | s)、xG(s)、T(s→s') 都由事件資料 counting 得到,然後解一組線性/迭代方程估計 xT。


二、為何 grid size 是關鍵設計選擇

如果 grid 很粗,例如 16 × 12,模型容易解釋,而且每格都有較多樣本,估計比較穩。但它會把很多不同情境混在一起:禁區邊緣同肋部傳球、不同角度的推進、不同風險區域,可能被迫共用類似狀態。

如果 grid 很細,模型能分辨更細緻的位置差異,理論上更有表達力。但每格樣本變少,transition matrix 變大,需要估計的機率更多,誤差自然上升。對球會而言,增加資料量往往不是免費的:不同 provider、不同 league、不同 season 也會引入 domain shift。

所以問題不是「grid 越細越好」,而是「在你手上資料量下,最細可以切到甚麼程度而仍然可靠」。


三、理論結果:誤差如何隨 M 和 N 變化

作者定義 model error 為真實 xT 與估計 xT 之間的最大差距:

  • ||xT - xT_hat||∞

在若干假設下,論文推導出 probabilistic upper bound。直覺上,誤差會隨 game states 數量 M 增加而上升,並隨 training points 數量 N 增加而下降。理論階數大致為:

  • O(M · sqrt(log M) / sqrt(N))

這個上界有助理解方向,但作者也指出,在實務 finite sample regime 下,實際誤差可能比上界更低,且衰減形式需要透過 simulation 更精準估計。


四、Simulation 設計

作者使用 StatsBomb open data,涵蓋 Premier League、Ligue 1、Serie A、La Liga、Bundesliga 的所有可用比賽,過濾出 passes、dribbles、errors、clearances、shots 等事件,得到約 4,000,000 events,約等於一個聯賽 6.5 個完整賽季

研究測試多種 grid size,包括:

  • 16 × 12,即 M = 192

  • 32 × 24,即 M = 768

  • 40 × 30,即 M = 1200

  • 48 × 36,即 M = 1728

  • 56 × 42,即 M = 2352

  • 64 × 48,即 M = 3072

對每個 grid size,作者先用完整 StatsBomb data 建立一個 ground-truth xT model,再從其 Markov chain 重新抽樣不同大小的 training datasets,重新訓練 xT,計算與 ground truth 的最大誤差。每組 M 和 N 重複 1,000 次,總共得到 48,000 個 simulation datapoints。


五、實務誤差模型

作者用 lognormal model 擬合最大誤差分佈:

  • ||xT_hat - xT||∞ = C · M^α / (sqrt(N))^β · exp(ε)

OLS 結果顯示 adjusted R² = 0.835,表示 M 與 N 已能解釋大部分誤差變異。估計出的參數約為 α = 0.9898β = 1.0416,即實務上誤差大致接近:

  • O(M^0.9898 / (sqrt(N))^1.0416)

這比理論上界少了 sqrt(log M) 的懲罰,說明理論 bound 保守,而 simulation 可以提供更貼近實務的估計。


六、Rule of Thumb:在可接受誤差下取最高 M

論文將上述誤差分佈轉化成一條給 practitioner 的規則:

選擇最高的 M,使 maximal model error 有 90% 機率低於 0.03。

這裡的 0.03 來自作者與專家討論後,認為對 scouting 用途而言,小於 0.03 的最大 xT 誤差可接受。當然,若用途是 broadcast explanation、academy scouting、或高價轉會決策,容忍度可以不同;但框架本身可替換 threshold。

文章舉例:如果使用 N = 2,480,000 個 training data points,大約等於 4 個聯賽賽季,符合 90% quantile < 0.03 的最高 M 是 130,約等於 13 × 10 grid。這比很多人直覺上想用的高解析網格保守得多,但更符合估計穩定性。


七、對足球分析實務的含意

第一,xT 的可解釋性不是免費的。它容易講、容易可視化,但網格設定仍是統計選擇,不應只靠習慣或美觀決定。

第二,資料量與模型解析度要匹配。若只用一季資料,切得太細可能令某些格子的 transition probability 極不穩定,最後球員評分看似精細,其實只是 sample noise。

第三,這種誤差框架可以幫助球隊把模型設計變成可討論的風險決策:我們想要更細的位置辨識,願意承受幾多 xT 誤差?我們是否有足夠跨賽季、跨聯賽資料支撐更高 M?


八、限制與延伸

這篇 paper 聚焦經典 grid-based xT。若使用 context-aware xT、continuous pitch model、tracking features、game state features,誤差結構可能不同。不過核心問題仍然存在:模型越靈活,估計越不穩。

另外,simulation 把完整 StatsBomb data 建出的 xT 視為 ground truth,這是合理近似,但仍受資料來源、聯賽風格、事件定義與 shot / move filtering 影響。若球會使用自家 provider 或特定聯賽資料,最好重新校準誤差分佈。


九、小結

arXiv:2511.09457v1 的貢獻不在於提出新 xT 公式,而是把一個常被忽略的工程選擇變成統計問題:grid size 越大,模型越靈活,但估計誤差也越高。

對使用 xT 做 scouting、opponent analysis、球員估值的人來講,這篇 paper 提供了一個實用提醒:先估算資料量能支撐多細的網格,再談模型解釋與可視化。否則,所謂更精細的 xT map,可能只是更精細的噪聲。


Reference

  1. K. W. van Arem, J. Sohl, M. Bruinsma, G. Jongbloed. The trade-off between model flexibility and accuracy of the Expected Threat model in football. arXiv:2511.09457v1 [stat.AP], 2025. https://arxiv.org/abs/2511.09457

  2. K. Singh. Introducing Expected Threat (xT). 2018. https://karun.in/blog/expected-threat.html

  3. M. Van Roy, P. Robberechts, T. Decroos, J. Davis. Valuing On-the-Ball Actions in Soccer: A Critical Comparison of xT and VAEP. AAAI Workshop on Artificial Intelligence in Team Sports, 2020.


原文 Paper



bottom of page