

數據樣本分割技巧:提升模型表現與可靠性
在數據科學及機器學習(Machine Learning)領域中,合理分割數據樣本對確保模型準確度和泛化能力至關重要。本文將深入探討樣本分割的重要性、常用技巧及實際應用注意事項,並以足球數據分析為例,說明這些概念在實際場景中的應用。...
2024年8月20日


AIP系統研究核心思維
隨著AIP預測系統上線接近一週年,我們開始回顧過去一年的預測模型表現。開發預測系統是一個持續學習的過程,讓我們深入探討這個領域的實際研究過程。 足球預測系統開發流程 一般來說,開發足球預測系統包括以下步驟: 構思(Idea Generation) 測試想法(Testing...
2024年8月17日


BeautifulSoup + Requests | Web Scraping in Python
開始之前,先簡單解釋一下什麼是Web Scraping(網頁爬蟲)。網頁爬蟲是一種用於從網站自動提取數據的技術,它通常涉及以下幾個步驟:發送HTTP請求到目標網站,下載HTML或其他格式的網頁內容,解析內容以提取所需的數據,最後存儲或進一步處理提取的數據,網頁爬蟲可用於多種...
2024年8月8日


大型語言模型到日常應用的演進
語言模型的運作原理與一般認知有所不同。這些模型並非即時上網搜索答案,而是通過在預先訓練的「參數」(parameters)中進行計算來生成回答。從技術角度來看,這個過程實際上是在預測序列中的下一個詞,我們稱之為「推理」(inference)。值得注意的是,用戶可以下載開源模型...
2024年7月24日


大型語言模型的局限性 : 破解AI思維
近年來,大型語言模型(Large Language Models, LLMs)的發展引起了學術界和產業界的廣泛關注。這些模型在處理自然語言任務方面展現出驚人的能力,從回答複雜問題到生成創意文本,都表現出色。然而,儘管它們在許多領域取得了突破性進展,研究者們發現這些模型仍然存...
2024年7月10日


賭徒謬誤(Gambler's Fallacy)
何謂賭徒謬誤? 賭徒謬誤是指人們錯誤地相信,若某個隨機事件近期頻繁發生,未來它發生的機會便會減少,反之亦然。這種思維方式與統計學原理相悖。 實例說明: 試想像在澳門某賭場的輪盤上,紅色已經連續出現了8次。不少賭客會認為,下一次黑色出現的機會更大,因為他們覺得「該輪到黑色了」...
2024年7月8日


凱利公式(Kelly Criterion) 的應用
凱利公式是由貝爾實驗室的John Kelly於1956年提出的一種資金管理方法。這個公式旨在最大化長期資金增長率,通過計算每次投注的最佳比例來實現這一目標。凱利公式的基本原理是在風險和回報之間尋找最佳平衡點。 凱利公式的數學表達如下: f* = (bp - q) / b...
2024年7月3日


數據小知識 : Feature Selection
在數據分析領域中,特徵選擇(Feature Selection)乃提升模型表現的關鍵步驟之一。特徵選擇指從原始數據集中挑選對預測結果最具影響力的變量,藉此提高模型的準確度及效率。此過程有助減低模型的複雜性,避免過度擬合(overfitting),並增強模型的可解釋性。...
2024年6月26日


數據小知識 : Data Visualization
在數據分析中,數據視覺化(Data Visualization)不僅是將數據轉化為圖形或圖表,更是以視覺方式呈現數據,以便更直觀地理解和分析數據。有效的數據視覺化能夠幫助我們發現數據中的趨勢、模式和異常,從而更好地做出決策。這一過程不僅需要選擇合適的圖表類型,還需掌握一定的...
2024年6月24日


建構足球預測系統流程
在現今的數據驅動時代,人工智能(AI)和數據分析在體育預測中的應用變得越來越普及。本文將從AI和數據分析角度,詳細介紹如何設定一個足球AI推介及預測系統,並解釋每個步驟中涉及的關鍵技術和工具。 一、需求分析和目標設定 在開始設計足球AI推介及預測系統之前,首先需要進行需求分...
2024年6月21日











































