バドミントンデータ解析ブログ

バドミントンについて、しょーもないことも含めてデータ解析で遊びます。主にTwitter(@badiary09)に生息しています。

バドミントンはサーバーとレシーバーどちらが有利か

タイトルの通りです.テニスはサーバー有利,バレーボールはレシーバー有利ということになっていますが,バドミントンはどちらなのかを調べてみました.

調査方法

単純に全ラリーのうちサーバーとレシーバーの勝率を比較しても正しい結果は得られません.なぜなら,ラリーの勝者が次のサーバーになるというルールであり,その結果強い選手ほどサーバーになりやすく,サーバーの勝率が高く見積もられてしまうからです.今知りたいのは,選手の実力差によらず,一般的にバドミントンという競技はサーバーとレシーバーにどのようなハンディが存在するのかということです.

この問題は,実力によってサンプル数が偏ってしまうことに起因しています.そこで,次のように調べることにしました.

  1. プレーヤーAとBが戦った一試合に注目する.
  2. Aがサーブの時にAが点を取った割合を p_s ^{(A)} ,Bがサーブの時にBが点を取った割合を p_s ^{(B)} としてそれぞれ計算する.
  3. 過去全ての試合( N試合とする)について p_s ^{(A)}  p_s ^{(B)} の平均 p_s ^{(mean)} を求める.{ \displaystyle
p_s ^{(mean)} = \frac{1}{2N} \sum_{全試合} \left( p_s ^{(A)} + p_s ^{(B)} \right)
}

3.においては,プレーヤーの区別はせず,とにかく全試合の平均を取ります.つまり,AとBにはその都度色々な人が対応するということです.このようにして求めた p_s ^{(mean)} を一般的なサーバーの勝率と解釈することにします.

相当荒っぽい求め方なのは重々承知していますが,この他に良い方法を思いつきませんでした.アイディア募集中!

データは2007年から2014年までのSuper Series,Grand Prix Gold,Grand Prixのランクの試合,全34652試合としました.今回は種目を区別して導出しました.

結果

まず,サーブ時の勝率 p_s  p_s ^{(A)} 及び p_s ^{(B)} )のヒストグラムを種目ごとにプロットしてみました. f:id:tenjin7:20150305225557p:plain f:id:tenjin7:20150305225605p:plain f:id:tenjin7:20150305225612p:plain f:id:tenjin7:20150305225623p:plain f:id:tenjin7:20150305225657p:plain

…特に何も考察できない気がします.

次に,本題の p_s ^{(mean)} を求めます.これは全体の平均で求めるので,ついでに標準偏差も求めてみました.

サーバーの勝率 p_s ^{(mean)} MS WS MD WD XD
平均 48.4% 47.7% 43.8% 46.2% 44.9%
標準偏差 12.8% 13.1% 12.1% 14.1% 12.2%

全ての種目でレシーバー有利,特にダブルスでそれが顕著であるという結果となりました.今回の求め方はかなり議論の余地がありますが,データ数が十分大きく,また推定バイアスはないんじゃないかと思っていることがあるので,レシーバーが有利であることは間違っていないのではと考えています.

結論

バドミントンは恐らくレシーバー有利です.しかし,テニスやバレーボールに比べるとそこまで大きな差はないようです.