8月17日
AIP系統研究核心思維
隨著AIP預測系統上線接近一週年,我們開始回顧過去一年的預測模型表現。開發預測系統是一個持續學習的過程,讓我們深入探討這個領域的實際研究過程。 足球預測系統開發流程 一般來說,開發足球預測系統包括以下步驟: 構思(Idea Generation) 測試想法(Testing...
8月8日
BeautifulSoup + Requests | Web Scraping in Python
開始之前,先簡單解釋一下什麼是Web Scraping(網頁爬蟲)。網頁爬蟲是一種用於從網站自動提取數據的技術,它通常涉及以下幾個步驟:發送HTTP請求到目標網站,下載HTML或其他格式的網頁內容,解析內容以提取所需的數據,最後存儲或進一步處理提取的數據,網頁爬蟲可用於多種...
7月24日
大型語言模型到日常應用的演進
語言模型的運作原理與一般認知有所不同。這些模型並非即時上網搜索答案,而是通過在預先訓練的「參數」(parameters)中進行計算來生成回答。從技術角度來看,這個過程實際上是在預測序列中的下一個詞,我們稱之為「推理」(inference)。值得注意的是,用戶可以下載開源模型...
7月10日
大型語言模型的局限性 : 破解AI思維
近年來,大型語言模型(Large Language Models, LLMs)的發展引起了學術界和產業界的廣泛關注。這些模型在處理自然語言任務方面展現出驚人的能力,從回答複雜問題到生成創意文本,都表現出色。然而,儘管它們在許多領域取得了突破性進展,研究者們發現這些模型仍然存...
7月8日
賭徒謬誤(Gambler's Fallacy)
何謂賭徒謬誤? 賭徒謬誤是指人們錯誤地相信,若某個隨機事件近期頻繁發生,未來它發生的機會便會減少,反之亦然。這種思維方式與統計學原理相悖。 實例說明: 試想像在澳門某賭場的輪盤上,紅色已經連續出現了8次。不少賭客會認為,下一次黑色出現的機會更大,因為他們覺得「該輪到黑色了」...
7月3日
凱利公式(Kelly Criterion) 的應用
凱利公式是由貝爾實驗室的John Kelly於1956年提出的一種資金管理方法。這個公式旨在最大化長期資金增長率,通過計算每次投注的最佳比例來實現這一目標。凱利公式的基本原理是在風險和回報之間尋找最佳平衡點。 凱利公式的數學表達如下: f* = (bp - q) / b...
6月26日
數據小知識 : Feature Selection
在數據分析領域中,特徵選擇(Feature Selection)乃提升模型表現的關鍵步驟之一。特徵選擇指從原始數據集中挑選對預測結果最具影響力的變量,藉此提高模型的準確度及效率。此過程有助減低模型的複雜性,避免過度擬合(overfitting),並增強模型的可解釋性。...
6月24日
數據小知識 : Data Visualization
在數據分析中,數據視覺化(Data Visualization)不僅是將數據轉化為圖形或圖表,更是以視覺方式呈現數據,以便更直觀地理解和分析數據。有效的數據視覺化能夠幫助我們發現數據中的趨勢、模式和異常,從而更好地做出決策。這一過程不僅需要選擇合適的圖表類型,還需掌握一定的...
6月21日
建構足球預測系統流程
在現今的數據驅動時代,人工智能(AI)和數據分析在體育預測中的應用變得越來越普及。本文將從AI和數據分析角度,詳細介紹如何設定一個足球AI推介及預測系統,並解釋每個步驟中涉及的關鍵技術和工具。 一、需求分析和目標設定 在開始設計足球AI推介及預測系統之前,首先需要進行需求分...
6月20日
小知識分享 - 數據清洗
在數據分析中,數據清洗(Data Cleaning)是至關重要的一步。數據清洗是指識別並糾正數據中的錯誤或不一致,以確保數據的質量和可靠性。這一步通常包括處理缺失值、去除重複數據、糾正格式錯誤和處理異常值等。舉例來說,在足球數據分析中,如果某球員的比賽數據顯示進球數為負數,...