ファイナルゲームでどちらが勝つか予測出来るか
三ヶ月前の話ですが,スポーツ安全国際センター(ICSS)という団体がスポーツに関係する賭博が広がっていることに関して警告を発しました(参考記事).賭博の市場があまりにも広がっていて,世界全体のGDPの2%を占めているらしいです.凄いですね.そして,賭博が広がっているスポーツの中にバドミントンが含まれているんです.確かに"badminton betting"で検索すると結構ヒットしますね.
最近Lee/Yooがスーパーシリーズ3連勝を成し遂げましたが,これを全部当てていたら一体何倍ぐらいになっていたんでしょうか...気になります.いや,それよりオーストラリアオープンで大穴の橋本由衣がベスト4に入ったの当てる方がすごいか.あとは,日本のトマス杯優勝・ユーバー杯準優勝もオッズは高かったんじゃないだろうか...
とまあ色々と考えが止まらないんですが,賭博があるなら誰が勝つかの予測を当然したくなります.どうやらトーナメントの優勝者を予想するのがポピュラーらしいんですが,ちょっと問題が難しすぎるので,まずはとても簡単なところから始めたいと思います.
今回は,試合がファイナルに入った場合の勝者を予測出来るか考えてみます.
第1ゲーム勝者と第2ゲーム勝者,どちらが勝つか?
まずは第1ゲームと第2ゲームどちらを取っているかが勝率に影響するかどうかを調べてみます.今回は対象とするデータを2007年~2013年のGrand Prix以上の大会とします.
全27873試合の中でファイナルまでいった試合は8223試合(約30%),うち第1ゲームの勝者が勝ったのは3944試合,第2ゲームの勝者が勝ったのは4279試合でした.これを二項検定にかけてみます.
data: c(3944, 4279) number of successes = 3944, number of trials = 8223, p-value = 0.0002299 alternative hypothesis: true probability of success is not equal to 0.5 95 percent confidence interval: 0.4687804 0.4904947 sample estimates: probability of success 0.4796303
p値が0.0002ということで,勝率には有意に差があるようです.第1ゲームの勝者の勝率が48%程度でした.
良く試合前のじゃんけんで始めは風や照明の点から不利なコートを選んだ方がいいということを聞きます.ファイナルまでいけば有利なコートでプレーする時間が長くなるからですが,その影響が表れた結果なのかもしれません.
得失点差は勝率に影響するか?
第2ゲームまでの得失点差は勝率に影響するのでしょうか.調べてみます.まずは,得失点差とそこから勝った試合の数のヒストグラムを見てみましょう.
なんだか凄く綺麗な形になりました.一つ飛び抜けているのは得失点差が0の場合です.これをピークとして外側になるにつれ減少していっていますが,どうも分布が右に偏っている気がしますね.分布が左右対称なら得失点差は第3ゲームの勝率に影響しないということになるのですが,どうもそうではないようです.
次に,得失点差ごとの第3ゲームの勝率を見てみましょう.(得失点差が負の部分は正の部分をひっくり返しただけです.)
...おお!結構綺麗な線形関係になっていますね.単回帰分析をすると,1点につき1.9%程度勝率が変わるようです.5点離れると勝率が10%違うというのは驚きです.正直得失点差はあまり関係ないものだと思っていました.
ちなみに,先ほどのヒストグラムで見たように,得失点差ごとにサンプル数が違っています.±15点を超えると数試合程度しかデータがないので,勝率が暴れています.
本当は検定を行いたいところですが,サンプル数が違うためどうやってかけたらいいか分かりません.さっきの単回帰分析も,本当は重み付き最小二乗をしないといけないですね.統計に詳しい方,どなたかご教授して頂けないでしょうか...
結論
ファイナルゲームの勝率は得失点差に大きく影響しています.得失点差×1.9%に第1ゲームと第2ゲームどちらを取ったかの2%分を加味した結果を信じるといいんじゃないでしょうか(適当です).
勢いとか流れといったメンタル的なことを考えるためには,各ゲームのスコアの推移まで考慮しないと駄目ですね.そちらも気になります.