top of page

用 Z-score 監測運動員生物標記:從足球員到單車手

  • 5月5日
  • 讀畢需時 5 分鐘

已更新:5月7日

高水平運動員的血液與尿液 biomarker 監測,既關乎健康管理,也關乎 anti-doping 與訓練負荷風險。問題是,每個人的基準值不同:同一個 ferritin、hemoglobin 或 IGF1 數值,對一名運動員可能正常,對另一名運動員可能已經偏離其個人長期模式。因此,單靠 population reference range 未必夠用。

Berthelot 等喺 arXiv:2510.01810v2 提出一套基於 Z-score 的 longitudinal biological monitoring framework,重點是用可解釋的統計方法,在個人內部變異(intra-individual variability)層面偵測異常 biomarker sequence。作者把方法應用到 3,936 名職業足球員(5 個 biomarker)與 1,683 名業餘/職業單車手(10 個 biomarker)資料上。


本文重點

這篇 paper 不主張用黑箱 AI 直接判斷「正常/異常」,而是提出一組 white-box Z-score 類方法,分別針對不同問題:單一異常點、連續一段異常 subsequence、多個 biomarker 的相關性,以及季節/時間等外部變量。

結果顯示,偵測「連續觀察值改變」的 T^(2) 方法在 ferritin 與 IGF1 上找出特別高比例的 abnormal sequences。足球員 ferritin abnormality 約 18.67%;單車手 ferritin 約 26.67%,IGF1 更達 35.97%。這些比例明顯高於設定的 5% false-positive rate,提示 biomarker 變動不只是隨機噪聲。


一、為何要做個人化 longitudinal monitoring

運動員生物護照(Athlete Biological Passport)背後的核心思想,是「看一個人自己和自己比」。因為運動員之間的生理差異很大,用單一人群範圍判斷異常,容易忽略個人基準。

例如兩名運動員 hemoglobin 都在正常範圍內,但其中一人的數值突然偏離自己過去多年模式,這可能比單次絕對值更值得關注。對醫療、訓練監控、anti-doping screening 而言,能夠早期偵測這類 deviation 很重要。

黑箱 machine learning 方法可以處理複雜 longitudinal data,但在醫療和運動監測這類高風險情境,解釋性、偏差來源、錯誤率控制都很關鍵。Z-score 類方法的優點是計算清楚、假設透明,也比較容易向醫生、運動科學團隊和監管機構解釋。


二、兩組運動員資料

足球員資料來自法國 elite leagues 1 和 2,共 3,936 名男性職業足球員,時間範圍為 2006 至 2019,共 27 次 collection。每約 6 個月採樣一次,涵蓋五個 biomarker:

  • ferritin

  • serum iron

  • hemoglobin

  • erythrocytes

  • hematocrit

單車手資料則包括 1,683 名男性運動員,當中有業餘、職業,以及曾轉換身份者。項目包括 road cycling、BMX、mountain biking、track sprint、cyclo-cross 等。資料涵蓋十個 biomarker,包括 ferritin、hemoglobin、reticulocytes、OFF-hr score、IGF1、cortisol、testosterone、osteocalcin 等。


三、第一步:先把資料轉得較接近 Gaussian

多數 Z-score 方法假設個人序列可近似 Gaussian sample,但 biomarker 原始分佈常常偏態、長尾或受生理下限影響。作者因此先對每個 biomarker 嘗試不同 deterministic transformations,例如 root transform、log transform、Lambert W、Box-Cox 等。

選 transformation 的方式是:對每個 transformed individual sequence 做 Shapiro normality test,再看 p-values 是否接近 uniform distribution,最後用 Kolmogorov-Smirnov test 選出整體最接近 Gaussian assumption 的 transformation。

這一步很重要,因為作者不是想把「不符合 normal distribution」本身當作異常,而是想在盡量合理的分佈假設下,偵測同一個人序列內的真正偏離。


四、幾種 Z-score 類偵測方法

最簡單的 Z-score 是比較最新觀察值與過去平均值,看它是否離個人 baseline 太遠。這適合問:「最新這一次 sample 是否異常?」

但 paper 討論的問題更廣,因此引入幾種 extension:

T^(1): 在整條 sequence 中找出任何單一 abnormal observation,而不只看最後一點。

T^(2): 偵測連續一段 observations 是否形成 abnormal subsequence。這有點接近 change point detection:不是某一點極端,而是一段時間的平均水準偏離其他時間。

T^(3): multivariate extension,同時考慮多個相關 biomarker,例如 erythrocytes、hemoglobin、hematocrit 的共同變化。

T^(4) / DevianLM: 把 Z-score 擴展到 Gaussian linear model,可加入 season 或 sampling date 等設計變量。Model A 是固定 baseline;Model B 加入 summer / winter season;Model C 使用 exact sampling date(適用於單車資料)。


五、主要發現:Ferritin 與 IGF1 特別突出

在設定 α = 0.05 的情況下,若資料完全符合 null model,預期 abnormal sequence 比例應接近 5%。但結果中,很多 biomarker 尤其在 T^(2) 方法下遠高於 5%。

足球員中,T^(2) 對 ferritin 偵測到約 18.67% abnormal sequences。單車手中,T^(2) 對 ferritin 約 26.67%,對 IGF1 約 35.97%。相比之下,其他方法如 DevianLM Model A/B/C 通常比例較低,較接近但仍常高於 5%。

作者認為 T^(2) 更敏感,因為它偵測的是一段連續觀察值的 level shift,而不是單一 outlier。這對長期訓練、營養、傷病或生理適應造成的 biomarker shift 特別有用。


六、為何 Ferritin 會有這麼多異常序列

Ferritin 與鐵代謝、炎症、訓練負荷、補鐵、失血、低能量可用性等因素相關。高水平運動員尤其 endurance athletes,ferritin 可能受長期訓練、海拔、營養策略、比賽期與恢復期變化影響。

作者亦提到,ferritin abnormality 可能反映多種原因:反覆耐力訓練、炎症或感染、iron loss / hemolysis、高原或 hypoxia、傷病導致 detraining、低鐵攝取或補鐵等。這些都不是單純「好/壞」判斷,而是提示需要進一步醫療或訓練背景解讀。

IGF1 亦類似,它與 growth hormone axis、訓練類型、能量赤字、蛋白質和總熱量攝取有關。單車手中 IGF1 的高 abnormality 比例,可能反映 endurance training、營養狀態與賽季負荷共同作用。


七、方法的實務價值

這個 framework 的實務價值,在於它可以作為 screening layer。它不直接說某個 athlete 有病或 doping,而是標出「這段 biomarker trajectory 相對個人歷史不尋常」,讓醫療團隊、運動科學家或 anti-doping reviewer 進一步調查。

相比黑箱模型,Z-score / DevianLM 的好處是可追溯:你可以知道是哪個 biomarker、哪段時間、相對哪個 baseline、在甚麼 season model 下被判定為異常。這種透明度對 medical decision support 很重要。

同時,框架也可以納入更多 covariates。例如若有訓練負荷、營養、傷病、海拔、藥物、檢測儀器等資料,就可以在 Gaussian linear model 中加入設計變量,避免把可解釋的生理因素誤判為異常。


八、限制與注意事項

第一,Z-score 方法依賴分佈與獨立性假設。雖然作者透過 transformation 改善 normality,但某些 biomarker 仍可能有 autocorrelation 或短期 biological variation,尤其若採樣間距較短。

第二,資料缺乏部分關鍵背景,例如訓練條件、營養策略、病理狀態、藥物、檢測設備或輸入錯誤。paper 提到 hemoglobin 中有約 4.45%(足球)4.75%(單車) constant sequences,可能包含設備或資料紀錄問題。

第三,偵測率高不等於臨床陽性率高。Ferritin 或 IGF1 異常序列可能來自正常訓練週期,也可能來自健康或 anti-doping 風險;需要 domain experts 做第二層判讀。


九、小結

arXiv:2510.01810v2 提供一套清楚、可解釋、可擴展的 athlete biomarker monitoring framework。它把個人長期序列中的異常偵測分成幾種問題:單點 outlier、連續 subsequence shift、多 biomarker 相關變化、以及季節/時間 effects。

對運動醫學與高水平表現團隊而言,這篇 paper 的重點不在於取代醫生判斷,而是提供一個透明的 early warning system:當運動員的 biomarker trajectory 開始偏離自己的 baseline,系統可以先把訊號提出來,讓人類專家決定下一步。


Reference

  1. G. Berthelot, B. Gelein, E. Meinadier, E. Orhant, J. Dedecker. Z-scores-based methods and their application to biological monitoring: An extended analysis of professional soccer players and cyclists athletes. arXiv:2510.01810v2 [stat.AP], 2025. https://arxiv.org/abs/2510.01810

  2. G. Sauliere, J. Dedecker, L.-A. Marquet, P. Rochcongar, J.-F. Toussaint, G. Berthelot. Z-scores-based methods and their application to biological monitoring: an example in professional soccer players. Biostatistics, 2019.

  3. M. Saugy, C. Lundby, N. Robinson. Monitoring of biological markers indicative of doping: the athlete biological passport. British Journal of Sports Medicine, 2014.


原文 Paper



bottom of page