<object id="68jaz"><nav id="68jaz"><address id="68jaz"></address></nav></object>

<p id="68jaz"><label id="68jaz"><menu id="68jaz"></menu></label></p>
<p id="68jaz"></p>
    <track id="68jaz"></track>

      <table id="68jaz"><noscript id="68jaz"></noscript></table>

      2018年俄羅斯世界杯賽程表完整版介紹這屆誰最有可能奪冠?

      導語:令廣大球迷興奮的2018年俄羅斯世界杯即將開始,對于球迷來說,每一屆世界杯中,除了球員精湛的球技之外,惹人關注的還有對奪冠球隊的預測。最近,多特蒙德工業大學(Technische Universitt Dortmund)的Andreas Groll教授,根特大學(Ghent University)的Christophe Ley教授、Hans Van Eetvelde教授,慕尼黑理工大學(Technical University of Munich)的Gunther Schauberger教授比較了一些足球比賽得分的建模方法,并使用一種基于隨機(決策)森林的建模方法,使用國際足聯的排名,平均年齡和冠軍聯賽球員數量,國家人口比率,國內生產總值,甚至教練的國籍等因素,對2018年世界杯足球賽進行預測。

      在這項研究中,我們比較了三種不同的足球比賽得分的建模方法,而這是根據它們在2002年至2014年四次國際足球聯盟世界杯(FIFA World Cups)的所有比賽中進行的預測性表現進行的:泊松回歸模型(Poisson regression models),隨機森林(random forests)和排名方法(ranking methods)。前兩種方法基于團隊的協變量信息,而后一種方法估計足夠的能力參數,而這些參數反映了當前團隊的最佳實力。在這個比較中,在訓練數據中表現最好的預測方法是排名方法和隨機森林。然而,我們表明,通過將隨機森林與來自排名方法的團隊能力參數相組合作為附加的協變量,我們可以大大提高預測能力。最后,我們選擇這種方法的組合作為最終模型,根據其估計,2018年世界杯將會被反復模擬,并獲得所有參賽隊伍的獲勝概率。較之衛冕冠軍德國,該模型略微偏向支持西班牙。此外,我們提供了所有球隊在所有錦標賽階段的生存概率以及最可能的錦標賽結果。

      就像之前的2014年世界杯一樣,即將在俄羅斯舉辦的世界杯也引起了若干位建模師們的注意,他們試圖預測出錦標賽的冠軍。有一種方法已經為過去歐洲錦標賽(歐洲杯)和國際足聯世界杯若干項賽事取得了合理的結果,這種方法是基于賭注登記經紀人(bookmakers)的幾率中所包含的預期信息(Leitner、Zeileis和Hornik于2010年、Zeileis、Leitner和Hornik于2012年、2014年、2016年提出)?,F在,對于這樣的重要賽事,賭注登記經紀人在錦標賽開始之前為獲勝者提供一個賭注。通過將若干家在線賭注登記經紀人的獲勝幾率匯總并將其轉化為獲勝概率,反向錦標賽模擬可用于計算特定于團隊的能力,關于這一點可參閱Leitner、Zeileis和Hornik(于2010年提出)的論文。憑借球隊特有的能力,所有單場比賽都可以通過配對比較進行模擬,因此,獲得了完整的錦標賽課程。Zeileis、Leitner和Hornik(于2018年)預測巴西將以16.6%的概率贏得2018年世界杯,其次是德國(15.8%)和西班牙(12.5%)。

      同樣的三支球隊被瑞士銀行UBS的一組專家確定為最受歡迎的球員,但具有不同的概率和不同的順序(Audran、Bolliger、Kolb、Mariscal和Pilloud,2018年):他們獲得德國最受喜愛的球員,獲勝概率為24.0%,其次是巴西(19.8%)和西班牙(16.1%)。他們使用一個基于四個因素的統計模型,而這四個因素將表明球隊在比賽期間的表現將如何:Elo評分,球隊在世界杯之前資格賽中的表現,球隊在前幾屆世界杯錦標賽中的成績和家庭優勢。該模型通過使用前五場比賽的結果進行校準,并進行10,000次蒙特卡羅模擬(Monte Carlo simulations)以確定所有球隊的獲勝概率。

      圖2:條形圖顯示了,應用于FIFA世界杯2002—2014年數據中的隨機森林中變量重要性,得分數量用作響應變量,論文第2部分描述的變量用作預測變量。

      另一個被證明在預測之前的國際足球錦標賽(如歐洲杯或世界杯)結果中有價值的模型類,是泊松回歸模型的類,它直接對兩個競爭團隊在單場比賽中的進球得分進行建模。設在i和j隊之間的比賽中,Xi j和Yi j分別表示第一和第二隊的目標,其中i,j∈{1,…,n},n代表錦標賽中球隊的總數。假設Xi jPo(λij)和Yi jPo(μij),其中λij和μij表示相應泊松分布的強度參數(即期望的目標數量)。對于這些強度參數,存在幾種建模策略,它們以不同方式將競爭團隊的能力或協變量包括在內。

      在最簡單的情況下,泊松分布被視為(條件性)獨立的,主要取決于團隊的能力或協變量。例如,Dyte和Clarke(于2000年)將此模型應用于國際足聯世界杯的數據中,并讓兩支參賽隊伍的泊松強度取決于他們的國際足聯排名。Groll和Abedieh(于2013年)以及Groll、Schauberger和Tutz(于2015年)分別對歐洲杯和世界杯數據分別考慮了一組潛在的有影響的變量,并使用L1懲罰方法來檢測相關協變量的稀疏集?;诖?,對2012年歐洲杯和2014年FIFA世界杯的賽事進行了預測。這些方法表明,當涉及到許多協變量和/或單變量的預測能力事先不明確時,正則化估計方法可能是有益的。

      許多研究人員已經放寬了對條件獨立性的強烈假設,并且引入了不同的可能性來將依賴分數考慮在內。Dixon和Coles(于1997年)首先確定了得分數之間的一個(輕微負)相關性。因此,他們引入了一個附加的依賴參數。然而,他們忽略了一個事實,即模型中的強度參數,包括兩個團隊的能力(或協變量)本身是相關的。因此,盡管以能力為條件,泊松分布被假定為獨立的,但它們是邊際相關的。Karlis和Ntzoufras(于2003年)提出用雙變量泊松分布(bivariate Poisson distribution)對兩個團隊的得分進行建模,該分布能夠解釋得分之間的(正)相關性。盡管雙變量泊松分布只能解釋正相關性,但基于copula的模型也允許負相關性(可參見McHale和Scarf于2007年、McHale和Scarf于2011年或Boshnakov、Kharrat和McHale于2017年所提出的觀點)。

      圖3:根據FIFA世界杯的100,000次模擬運行以及根據ODDSET賠率獲勝的概率,為所有32支球隊進入2018年世界杯足球賽不同階段的預測概率(以百分比表示)。

      然而,關于雙變量泊松的案例,Groll、Kneib、Mayr和Schauberger(于2018年)提供了一些證據,如果兩個競爭團隊的高信息量協變量都包含在兩個(條件性)獨立泊松分布的強度中,那么比賽分數的依賴結構可以被適當地建模。他們包括了歐洲杯數據的一大組協變量,并使用提升算法(boosting approach)來選擇一個用于預測2016年歐洲杯的稀疏模型。由于雙變量泊松分布的依賴性參數從未被提升算法更新過,所以有兩個(條件性)獨立泊松分布就足夠了。

      與基于協變量的泊松回歸模型密切相關的是基于泊松的足球隊伍排名方法。主要思想是找到能夠反映當前團隊最佳實力的足夠多的能力參數。以一組比賽為基礎,然后通過最大似然法(maximum likelihood)估計那些參數。Ley、Van de Wiele和Van Eetvelde(于2018年)研究了各種泊松模型,并對它們的預測性能進行了比較。由此產生的最佳模型是獨立泊松模型以及Karlis和Ntzoufras(于2003年提出)的最簡單的雙變量泊松分布。有趣的是,Ley等人(于2018年)發現,這些模型在國內聯賽和國家隊比賽中的表現都優于對手。這些基于統計力量的排名為國際足聯的排名提供了一個有趣的選擇。

      一種完全不同的建模方法是基于隨機(決策)森林(random (decision) forests),這是一種由Breiman(于2001年)提出的用于分類、回歸和其他任務的集成學習方法。該方法起源于機器學習和數據挖掘社區,并且首先通過在訓練數據上構建大量所謂的決策樹進行操作的。然后,通過采用預測類的模式(在分類中)或平均預測值(在回歸中)來總結單個樹的預測結果。這樣,與常規決策樹相比,隨機森林減少了過度擬合的趨勢和方差,因此,它是常用的強大預測工具。在Schauberger和Groll(于2018年)的初步研究中,不同類型的隨機森林已經與傳統的計數數據的回歸方法(如上述泊松模型),在包含2002 – 2014年FIFA世界杯的所有比賽的數據上對預測性能進行了比較。事實證明,隨機森林提供了非常令人滿意的結果,并且通常要優于回歸方法。而且,他們的預測表現實際上要么接近甚至超過作為自然基準的賭注登記經紀人的表現。這些結果激勵我們在目前的研究中使用隨機森林來計算即將到來的2018年FIFA世界杯的預測。然而,我們將證明,如果能夠對反映國家隊目前的實力的團隊能力參數進行充分的估計,并將其作為附加的協變量,隨機森林現有的非常出色的預測能力可以得到進一步的改進提高。

      發表回復

      您的電子郵箱地址不會被公開。 必填項已用*標注

      丰满少妇chinese

      <object id="68jaz"><nav id="68jaz"><address id="68jaz"></address></nav></object>

      <p id="68jaz"><label id="68jaz"><menu id="68jaz"></menu></label></p>
      <p id="68jaz"></p>
        <track id="68jaz"></track>

          <table id="68jaz"><noscript id="68jaz"></noscript></table>